文字探勘、文本共現及網路分析 蔡芸琤 教授
文字探勘、文本共現及網路分析 蔡芸琤 教授
文字探勘、文本共現及網路分析

講座系列

AI for Lawyers系列

講座進程

已開課

講座日期

2022-07-07

講座地點

遠端線上連線

單位與講者

講座介紹

資料科學中的「共現性(Co-occurrence)」,指字詞間共同出現在所擷取之文本或語料單元的現象,當共現頻率出現越高,表示兩字詞之間的關係越緊密。以影片推薦系統來思考,若觀看A影片的人有極高比例均會觀看B影片,則可想像A影片與B影片在一定程度有緊密關聯,因此當你觀看A影片時,平台很可能就會出現「你可能也會喜歡B影片」的推薦。如果要更直觀的用圖像理解共現性,我們可以製作文本共現網路圖,節點面積愈大表示該字詞出現次數愈多、節點間連線粗細則代表兩字詞共現的次數多寡,倘若該字詞若與多個字詞相關,則會使其位置偏向共現網路圖的核心。共現網路分析不僅可運用在推薦系統,在法律科技層面更可透過自定義關鍵詞,來評估不同犯罪之間的關聯性、不同量刑因子的關聯性等諸多運用。

單位

財團法人理律文教基金會-circle
財團法人理律文教基金會
999 堂講座
東吳大學 Logo
東吳大學
167 堂講座

講者

蔡芸琤-square
蔡芸琤
教授
3 堂講座

寒暑假營隊連結