自家用 Kotlin 爬蟲實戰:以統整多平台 Podcast 聆聽數據為例

By Shengyou Fan

議題

自家用 Kotlin 爬蟲實戰:以統整多平台 Podcast 聆聽數據為例

AU [[ new Date( '2023-07-29 02:10:00+00:00' ).toLocaleDateString('ja', {year: 'numeric', month: '2-digit', day: '2-digit'}) ]] [[ new Date( '2023-07-29 02:10:00+00:00' ).toLocaleTimeString('zh-Hant', {hour12: false, hour: '2-digit', minute:'2-digit'}) ]] ~ [[ new Date( '2023-07-29 02:40:00+00:00' ).toLocaleTimeString('zh-Hant', {hour12: false, hour: '2-digit', minute:'2-digit'}) ]] zh-tw
加入行事曆 加入關注 加入關注 已關注

使用爬蟲截取網頁上的資訊已是常見的資料處理技術。由於數據分析的盛行,市面上的教學大多以 Python 示例。但其實剖析爬蟲技術的核心,坐擁 JVM 生態系的 Kotlin 也能輕鬆辦到。在這場分享裡,將會以 Kotlin 爐邊漫談 Podcast 節目製作組需要統整各平台聆聽數的需求為例,說明如何使用 JVM 生態系的解析套件及爬蟲框架抓取目標資料並整理儲存至資料庫。另外,也會針對不同的資料格式來源、定時排程等延伸主題進行討論。聽完這場分享後,Kotlin 初學者也能快速上手,快速成為爬蟲擷取能手。

講者

Shengyou Fan

Shengyou Fan

JetBrains 技術傳教士,負責推廣 IDE 工具及開放原始碼技術。平時醉心於技術研究,期待能將複雜的技術詞彙以通俗易懂的方式讓人人都能吸收。工作之餘積極參與 PHP 及 Kotlin 社群運作,曾創辦 Laravel 道場、LaravelConf Taiwan、Kotlin 讀書會/練功場及 Kotlin 中文開發者大會,錄了 Kotlin 爐邊漫談 Podcast,還意外出了一本《Kotlin Collection 全方位解析攻略》。技術之外是位甜點吃貨。

JVM United JVM 聯合國 J7RHCH general (30mins)