Pentaho - Screen Scraping "Daftar Kabupaten/Kota" Halaman Wikipedia

Loading...

Sign in or sign up now!
Alert icon
Upgrade to the latest Flash Player for improved playback performance. Upgrade now or more info.
417 views
Loading...
Alert icon
Sign in or sign up now!
Alert icon

Uploaded by on Feb 8, 2011

Video ini menggambarkan solusi dari thread pertanyaan "Mendapatkan Data Kota dan Provinsi" di User Group Pentaho Indonesia.

Berikut adalah gambaran solusinya :
- Baca halaman http://id.wikipedia.org/wiki/Daftar_kabupaten_dan_kota_Indonesia (Text file input)
- Cari dan deteksi pola source dari halaman tersebut untuk Propinsi, Kabupaten/Kota dan Pusat Pemerintahan. Masing2 untuk tiap fase dan pisahkan dengan capture field group (Regex Evaluation)
- Lakukan deteksi level break dari tiap row untuk masing2 group di atas (Modified Java Script Value)
- Pisahkan stream untuk tiap fase grouping dan lakukan lookup untuk menggabungkan kembali (Filter rows dan Stream Lookup)
- Untuk source lain yang tidak perlu kita filter out (Filter Rows)
- Lakukan step lainnya sesuai logika masing2. Untuk script saya, saya menggunakan Denormalization
- Selesai

Category:

Science & Technology

Tags:

License:

Standard YouTube License

  • likes, 0 dislikes

Link to this comment:

Share to:
see all

All Comments (0)

Sign In or Sign Up now to post a comment!
Loading...

Alert icon
0 / 00Unsaved Playlist Return to active list
    1. Your queue is empty. Add videos to your queue using this button:
      or sign in to load a different list.
    Loading...Loading...Saving...
    • Clear all videos from this list
    • Learn more