Traditional Chinese AI Open Source Grant
活動共筆:https://g0v.hackmd.io/@jothon/AI_Grant_20240803
講者
Richard 林旅強
Richard 林旅強(強哥),早期COSCUP志工,從09年起加入中研院自由軟體鑄造場,開始投身開源相關工作;14年登陸左岸,當年聯合創辦了開源社;曾在華為做了快8年的開源和開發者生態工作,現於零一萬物 01.AI(創始人:李開復)擔任開源暨開發者關係負責人。翻譯過兩本書,《開發者關係:方法與實踐》在23年出版;《開源項目——超越代碼》預計今年10月出版。
講者
李慕約
李慕約是 Generative AI 社群 ( gaiconf.com ) 的主辦人,這是一個致力於推廣生成式 AI 的社群。
李慕約同時也是李慕約公司(muyueh.com)的負責人,這家公司提供資料視覺化、大數據分析等服務,客戶包括中華電信、遠傳電信、玉山銀行等企業,
李慕約過去曾任 COSUCP 2014、2015、2016 的講者,講述開放資料以及資料視覺化的主題。
講者
g0v 揪松團
https://jothon.g0v.tw/
g0v 零時政府揪松團是 g0v 社群籌辦雙月大黑客松(大松)和基礎松,以及推動募款事務的工作小組,目前有七位志工和二位職工。2012 年開始協助社群籌辦黑客松,2014 年正式組成「揪松團」(jothon),2016 年起,啟動社群基礎建設計畫,開辦「基礎松(infrathon)」,在大黑客松之餘,推動更順暢的線上/線下跨界協作,並於同年底推出「g0v 公民科技創新獎助金(Civic Tech Prototype Grant)」 ,鼓勵 g0v 專案持續投入開發和長期維護、營運。2020 年開辦「零時小學校(Sch001)」,與教育、開源社群一起從零重新思考學校的角色。2024 年執行「繁體中文 AI 開源實踐計畫」,鼓勵民間團隊實踐在地化語言模型的相關工作。
The g0v Jothon is responsible for organizing bi-monthly hackathons, infrathons and promoting fundraising activities. Currently, the team consists of seven volunteers and two staff members.Jothon began as a task force assisting the community in organizing hackathons in 2012 and was formally named Jothon in 2014. In 2016, Jothon initiated the Community Infrastructure Project and launched a series of “Infrathons” to promote smoother online/offline collaboration alongside regular hackathons. In the same year, Jothon introduced the “g0v Civic Tech Prototype Grant” to encourage continuous development and long-term maintenance and operation of g0v projects. In 2020, Jothon launched “Sch001” to rethink the role of schools from scratch together with the education and open-source communities. In 2024, Jothon executed the “Traditional Chinese AI Open Source Practice Project” to encourage civil teams to work on localized language model-related tasks.
講者
台灣人工智慧學校秘書長 侯宜秀 (Isabel Hou)
https://conf2023.aiacademy.tw/isabel-hou/
講者
國立高雄大學資工系 吳俊興 副教授
https://wuch.icslab.org/
講者
國立中央大學資訊電機學院資訊工程學系 蔡宗翰 教授
蔡宗翰教授為國立中央大學資訊工程學系教授,同時受聘於理工屬性的中央大學資工系與人文屬性的中研院人社中心,研究領域涵蓋資訊領域的自然語言處理、電腦視覺等 AI 技術,並將這些 AI 技術用於解決人文研究問題,也就是所謂「數位人文研究」,為台灣少見之跨理工人文的學者。
此外,更愛好寫文章與作詩,因而被稱為「 AI 界李白」。著有《寫給中學生看的AI課(增訂版)》,榮獲第十二屆吳大猷科學普及著作獎青少年科普特別推薦獎。
個人網頁:https://cis.ncu.edu.tw/iTeacher/home/0xf91f62aecb314932c2593a99c0edf493
講者
卓騰語言科技創辦人暨核心開發工程師 王文傑 (Peter Wolf)
https://sites.google.com/site/peterwolftw/
講者
MediaTek Research 聯發創新基地負責人 許大山 博士
https://i.mediatek.com/zh-tw/mediatekresearch https://www.linkedin.com/in/da-shan-shiu/
活動共筆:https://g0v.hackmd.io/@jothon/AI_Grant_20240803
繁體中文 AI 開源實踐計畫的目標在於促進具有高度透明度(Transparency)、重用性(Reusability)與永續性(Long-term Impact)的 Gen AI 專案,鑑於 AI 模型日新月異,本計畫著重將資源挹注於高品質開源資料集(High-quality open dataset)的整理蒐集工作,讓成果可以對現在與未來繁體中文模型的建構都能有所貢獻。計畫關注於建構語言模型訓練之繁體中文文本資料、Benchmark 台灣觀點的評測,並鼓勵如台語相關團隊投入。本次議程將由本計畫合作的各個參與團隊分享各團隊的開源成果與執行經驗,成果將陸續開源於 Hugging Face 平台,六組團隊如下:
➀ 台灣語言模型競技場 Taiwan Chatbot Arena ➁ LegaL-Mind:智慧法律諮詢系統 ➂ 大量閱讀台灣研究的健康促進小幫手 ➃ 建置定期更新的立委發言觀測儀表板與政治時事資料集 ➄ 台灣AI教學共創實驗室 ➅ 台語自動分詞與詞性標記系統
繁體中文 AI 開源實踐計畫與合作團隊介紹、開源成果網址: https://g0v.hackmd.io/@jothon/AI_Grant_20240803
繁體中文 AI 開源實踐計畫,籌辦單位: .聯絡我們:jothon-organizers@g0v.tw .【主辦單位】g0v 揪松團 (https://jothon.g0v.tw/about/) 、零時小學校 (https://sch001.g0v.tw/) .【贊助單位】Brighter Capital (https://brightercapital.com/) .【合辦單位】財團法人開拓文教基金會 (https://www.frontier.org.tw/blog2/) 、財團法人開放文化基金會 (https://ocf.tw/) 、Taiwan National Treasure Foundation (https://www.nationaltreasure.tw/en)
講者
g0v 揪松團
https://jothon.g0v.tw/
g0v 零時政府揪松團是 g0v 社群籌辦雙月大黑客松(大松)和基礎松,以及推動募款事務的工作小組,目前有七位志工和二位職工。2012 年開始協助社群籌辦黑客松,2014 年正式組成「揪松團」(jothon),2016 年起,啟動社群基礎建設計畫,開辦「基礎松(infrathon)」,在大黑客松之餘,推動更順暢的線上/線下跨界協作,並於同年底推出「g0v 公民科技創新獎助金(Civic Tech Prototype Grant)」 ,鼓勵 g0v 專案持續投入開發和長期維護、營運。2020 年開辦「零時小學校(Sch001)」,與教育、開源社群一起從零重新思考學校的角色。2024 年執行「繁體中文 AI 開源實踐計畫」,鼓勵民間團隊實踐在地化語言模型的相關工作。
The g0v Jothon is responsible for organizing bi-monthly hackathons, infrathons and promoting fundraising activities. Currently, the team consists of seven volunteers and two staff members.Jothon began as a task force assisting the community in organizing hackathons in 2012 and was formally named Jothon in 2014. In 2016, Jothon initiated the Community Infrastructure Project and launched a series of “Infrathons” to promote smoother online/offline collaboration alongside regular hackathons. In the same year, Jothon introduced the “g0v Civic Tech Prototype Grant” to encourage continuous development and long-term maintenance and operation of g0v projects. In 2020, Jothon launched “Sch001” to rethink the role of schools from scratch together with the education and open-source communities. In 2024, Jothon executed the “Traditional Chinese AI Open Source Practice Project” to encourage civil teams to work on localized language model-related tasks.
講者
台灣語言模型競技場 Taiwan Chatbot Arena
專案簡介:https://sch001.g0v.tw/dash/prj/Psgw1_h15KNJoFo55nCCo4GTTi_Q7C Hugging Face:https://huggingface.co/datasets/aigrant/tw_chatbot_arena
講者
LegaL-Mind:智慧法律諮詢系統
專案簡介:https://sch001.g0v.tw/dash/prj/PscU0Ax3sXd6bCUw57AB6Tybr4BlnR Hugging Face:https://huggingface.co/datasets/aigrant/Legal-Mind-Mix-160K
講者
大量閱讀台灣研究的健康促進小幫手
專案簡介:https://sch001.g0v.tw/dash/prj/PqYu6bC3rc.Ii6Qc5h99T3JtbtQn2o Hugging Face:https://huggingface.co/datasets/aigrant/medical_health
講者
建置定期更新的立委發言觀測儀表板與政治時事資料集
專案簡介:https://sch001.g0v.tw/dash/prj/PuH4T8g4v2yywCP85Wc9MluRFz_HCh Hugging Face:https://huggingface.co/datasets/aigrant/taiwan-legislator-transcript Hugging Face:https://huggingface.co/datasets/aigrant/taiwan-ly-law-research
講者
台灣AI教學共創實驗室
專案簡介:https://sch001.g0v.tw/dash/prj/PwDWHhZ3DFGZfDP55_uBm3R_T3ypcr Hugging Face:https://huggingface.co/datasets/gatelynch/awesome-taiwan-knowledge
講者
台語自動分詞與詞性標記系統
專案簡介:https://sch001.g0v.tw/dash/prj/PwBWl.O3AIxboDff5pXCq.DBAx1Eza Hugging Face:https://huggingface.co/datasets/aigrant/Taiwanese-Chinese_characters-POJ-Collection