AI生成PPT的「幻觉」有多严重？实测6款工具的数据准确性

问题的起因

上周一个朋友找我吐槽：他用某AI工具生成了一个融资路演PPT，拿给投资人看，对方当场指出”你们这个市场规模数据是错的”。他回去一查——AI把2023年的数据和2024年的数据搞混了，中间差了三倍。

这件事让我开始思考：AI做PPT的速度确实快，但数据准确性呢？

于是我拉了一个测试：选6款主流的AI演示工具，给它们同一组数据要求（“2024年中国SaaS市场规模约836亿元，同比增长18.2%”），看看它们能不能原封不动地保留数据。

测试方法很简单：给每款工具同样的prompt，明确要求”请保留以下数据的原始数字，不要修改”，然后检查输出。每款工具测3次，取最差的那次作为记录。

先说结论：6款工具中没有一款是100%不出错的。但差异确实很大。

Gamma 的表现最好。3次测试中2次数据完全正确，1次把”同比增长18.2%“写成了”增长约18%“。可以接受——四舍五入了一下，没改变事实。

Tome 的问题比较有意思。它不是改数据，而是”添油加醋”。比如它在市场规模后面加了”预计2025年突破千亿”——这个推论也许合理，但原文没给，它自己编的。如果这是商业文档，这种”合理补充”可能会惹麻烦。

WPS AI 的表现让我意外。3次测试中有1次数据完全准确，2次出现了”串行”——把SaaS市场数据和云计算数据搞混了。这大概率是因为它的训练数据里有大量相关报告，上下文一混淆就搞错了。

Canva AI 的问题在于”模糊化”。它倾向于把”836亿元”写成”超过800亿元”，把”18.2%“写成”近20%“。数字变”圆润”了，但对需要精确数据的人来说，这是不可接受的。

Gamma 中国版 的表现比国际版差一些。可能是因为中文数据处理链路不一样，它在处理”亿元”这种中文单位时出过一次错——写成了”836亿美金”。

讯飞智文 是翻车最严重的。3次测试中1次数据正确，1次完全编了一组新数据，1次把年份搞错了。如果用它做需要精确数据的商业汇报，风险太高。

说白了，大语言模型本质上是一个”预测下一个词”的机器。当它看到”市场规模约”，它的训练语料里最常见的下文就是”XXX亿元”——然后它就按概率生成了一组看起来合理的数字。

它不是在”查数据”，它是在”写作文”。

这对PPT的影响是致命的：PPT的核心就是信息传达，如果你的数据不准，再好看的排版也没用。

基于这次测试，我总结几个原则：

AI做PPT绝对不是不能用。恰恰相反，它把做PPT的效率提升了至少5倍。

但效率和准确性，你只能二选一的时候，永远选准确性。 一个数据错误毁掉整个演示的信任感，不值得。

我的建议：用AI搭框架、定风格、排初版，但数据部分永远自己把关。

[ Google AdSense 广告位 ]