
欧洲公共媒体进行一场实测,询问ChatGPT等4个主要AI助理模型有关新闻事件的问题,结果有大约一半答错。(法新社档案照)
人工智慧(AI)技术正在全球改写许多产业面貌,包括新闻业。欧洲公共媒体进行一场实测,询问ChatGPT等4个主要AI助理模型有关新闻事件的问题,结果有大约一半答错,包括把新闻事件与讽刺内容混淆,以及无中生有,杜撰事件。
法新社21日报导,欧洲广播联盟(European Broadcasting Union)21日公布这份大型研究指出,不分语言或来源国,主流AI助理如ChatGPT、Copilot、Gemini和Perplexity对新闻事件的回答,45%出现「至少一项重大问题」;约5分之1的回答「含有严重失准问题,包括凭空捏造细节,以及资讯过时」。
这项测试由18个以欧洲居多数的国家、共22家公共媒体参与,在5月底到6月初,向前述AI机器人提出相同问题,回收约3000则回应。这4款系统中,「Gemini表现最差,76%的回应有重大瑕疵」,是其他3个系统的2倍多,主要与引用资讯表现不佳有关。
提供过时资讯是测试中AI常见的通病。例如询问「现任教宗是谁」,芬兰国家广播公司(Yle)测试ChatGPT,和荷兰广播基金会(NOS)、荷兰公共广播(NPO)测试Copilot和Gemini,得到的回答都是「方济各」(Pope Francis),但是测试当时方济各已过世,由良十四世(Leo XIV)接任。
法国广播电台(Radio France)询问有关美国富豪马斯克(Elon Musk)在美国总统川普1月就职庆典,疑似行纳粹礼的传闻,Gemini显然把一篇喜剧演员的讽刺,信以为真,回答「他的右臂勃起」。
欧洲广播联盟副秘书长坦德(Jean Philip De Tender)和英国广播公司(BBC)AI主管阿契尔(Pete Archer)表示:「AI助理目前还不是获取和浏览新闻的可靠方式」。
尽管如此,AI机器人愈加被用来取得资讯、尤其是年轻人。根据路透新闻学研究所(Reuters Institute)6月发表的一份全球报告,25岁以下族群中,15%的人每周使用AI助理取得新闻摘要。
来源:自由时报