专家实测6大AI工具可靠度榜首出人意料

发布：2025年12月01日 18:53 来源：自由3C科技

发布：2025年12月01日 18:53

来源：自由3C科技

现在人碰到问题，第一直觉反应就是问 AI！但是到底哪一个 AI 工具才最准确？或许每个人都有不一样的感受，对此英国消费者组织《Which?》就联合专家，针对六组常见的 AI 工具进行实测，结果 Gemini、ChatGPT 都无法获得最高分。

《Which?》针对 ChatGPT、Google Gemini、Gemini AI Overview （Google 搜寻的 AI 摘要）、Microsoft Copilot、Meta AI 及 Perplexity 等六个工具进行测试，每个 AI 会被询问包含个人理财、法律、健康与饮食、消费者权益及旅游等不同面向、共 40 个问题，再由专家确认准确度、清晰度、实用性、伦理责任等指标，进而给出整体评分，结果如下（分数越高越好）：

1.Perplexity：71%

2.Gemini AIO：70%

3.Gemini 69%

4.Copilot：68%

5.ChatGPT：64%

6.Meta AI：55%

调查发现，AI 给予的答案存在许多隐忧，例如许多来源引用 Reddit 论坛或未知网站，并非来自权威内容，甚至有的 AI 会提供错误的理财、医疗资讯。当旅游碰到意外时，它甚至可能误导取消机票可以全额退费，或是对于票务规则本身就有错误理解，在法律上的专业度也明显不足，没有提醒消费者应该征询专业的法律建议。

《Which?》科技专家 Andrew Laughlin 指出：“我们的研究发现，AI 有太多令人不安且不准确的误导性陈述，尤其是在碰到财务、法律谘询等重要议题时。”他警告用户，使用 AI 务必明确定义问题，并且仍要检查资讯来源，对于医疗、财务等复杂议题，一定要寻求专业谘询后，再做出重大决定。