// NEXUS_DOLANANDATA_2026 //

FLOOD SEGMENTATION

Aerial flood mapping via SegFormer-B3 // Triple Loss (CE+Dice+Focal) // 4x TTA Inference // 47.2M Parameters

0

Best Val mIoU

0

Training Images

0

Parameters

10

Semantic Classes

// EXPLORATORY DATA ANALYSIS

Analisis Dataset

Eksplorasi mendalam terhadap 1.892 citra aerial (1.444 train + 448 val) dengan 10 kelas segmentasi.

Sampel Gambar Dataset

Sample 6358

Sample 6676

Sample 7118

Sample 7193

Sample 7313

Sample 8967

Class Pixel Distribution

Kelas grass dan tree mendominasi lebih dari 50% total piksel, sementara kelas vehicle dan water sangat langka (<2%). Ketimpangan ini memerlukan class weighting khusus.

Class Imbalance

Visualisasi skala logaritmik memperlihatkan perbedaan jumlah piksel antar kelas yang sangat ekstrem — hingga 100x lipat antara kelas dominan dan minoritas.

Class Frequency

Frekuensi kemunculan kelas di seluruh gambar. Kelas building_non_flooded dan road_non_flooded hampir tidak muncul sama sekali di data.

Co-occurrence Heatmap

Heatmap co-occurrence menunjukkan kelas mana yang sering muncul bersamaan dalam satu gambar. Tree + Grass adalah pasangan paling umum.

Pixel Pie Chart

Proporsi piksel per kelas dalam bentuk pie chart. Sangat jelas terlihat dominasi kelas vegetasi (grass + tree).

Coverage Boxplot

Boxplot menunjukkan variasi cakupan (coverage) setiap kelas per gambar. Kelas langka memiliki median mendekati nol dengan outlier tinggi.

Train vs Val

Perbandingan distribusi piksel antara data Train dan Validasi. Distribusi yang mirip memastikan validasi yang representatif.

Class Richness

Histogram jumlah kelas unik per gambar. Rata-rata setiap gambar mengandung 3-4 kelas berbeda.

Objects per Image

Distribusi jumlah objek per gambar. Mayoritas gambar memiliki 5-15 objek anotasi individual.

Image Dimensions

Scatter plot dimensi gambar. Sebagian besar gambar berukuran seragam (640×480 piksel).

Size Heatmap

Heatmap konsentrasi ukuran gambar. Mayoritas terkonsentrasi di satu titik (resolusi seragam).

// MODEL ARCHITECTURE

SegFormer-B3

Arsitektur Transformer untuk segmentasi semantik dari NVIDIA, di-fine-tune pada dataset banjir aerial.

IN

Input Image
480×640

→

B3

MIT-B3
Encoder

→

FE

Multi-Scale
Features

→

ML

MLP Decode
Head

→

UP

Upsample
Bilinear 4×

→

10

Segmentation
Map (10 cls)

Backbone

MIT-B3

Parameters

47.2M

Pre-trained

ImageNet-1K

Input Size

480 × 640

Batch Size

16 (8/GPU)

GPU

2× Tesla T4

Optimizer

AdamW

Scheduler

OneCycleLR

Loss Function

CE + Dice + Focal

Loss Weights

0.3 / 0.5 / 0.2

Epochs

25

AMP

FP16 Mixed

// TRAINING RESULTS

Kurva Pelatihan

Visualisasi perjalanan model selama 25 epoch pelatihan pada dual GPU Tesla T4.

Training Curves

0.3683

Best Val mIoU

0.5205

Best Val mDice

0.6149

Pixel Accuracy

Ep 19

Best Epoch

Epoch	Tr Loss	Tr mIoU	Val Loss	Val mIoU	Val mDice	Status

// PER-CLASS ANALYSIS

Performa Per Kelas

Rincian IoU per kelas menunjukkan kekuatan dan kelemahan model pada masing-masing kategori segmentasi.

Per Class IoU

// PREDICTION GALLERY

Hasil Prediksi (Before-After)

Visualisasi overlay prediksi model pada gambar test menggunakan Test-Time Augmentation (TTA) 4×.

Building Flooded

Building Non-Flooded

Grass

Pool

Road Flooded

Road Non-Flooded

Tree

Vehicle

Water

Prediction 6445

Original vs Predicted MaskID: 6445

Prediction 6561

Original vs Predicted MaskID: 6561

Prediction 9037

Original vs Predicted MaskID: 9037

Prediction 9367

Original vs Predicted MaskID: 9367

Prediction 9721

Original vs Predicted MaskID: 9721

// SUBMISSION STATISTICS

Statistik Submisi

Ringkasan file submission.csv yang diunggah ke Kaggle Leaderboard.

0

Total Rows

0

Test Images

0

Non-Empty Predictions

0

Detection Rate

~12 MB

File Size