跳到主要内容

一个基于 GPT-3 的拍照搜题工具

· 阅读需 2 分钟
xyspg

一个使用 Teseeract OCR 和 GPT-3 的拍照搜题工具

众所周知,像作业帮、小猿搜题这些 app 通常只能搜索国内的题库,而面对国外的 AP 等英文题目则无法搜索 拍什么题都会返回英语卷子
因此,我写了一个基于 GPT-3 (ChatGPT 是 GPT-3.5) 的拍照搜题工具,因为使用的是 AI 语言模型,所以理论上什么题都可以搜。但是同样的准确性也十分有限,不同于传统搜题软件通过题库来匹配(这种方式的准确性是非常高的),这个工具的准确性取决于 GPT-3 的回答,而 「ChatGPT 有时会写出看似合理但不正确或荒谬的答案1」,所以请不要把这个工具当作传统搜题软件来使用,在得到回答的时候请务必仔细辨别。
目前这个工具使用的是开源的 Teseeract.js OCR 库来进行 OCR 识别。实际测试下来识别速度还不是很理想,所以未来可能会考虑更换 Google Vision API 或者 Azure Computer Vision API 等。


  1. ChatGPT sometimes writes plausible-sounding but incorrect or nonsensical answers. Fixing this issue is challenging, as: (1) during RL training, there’s currently no source of truth; (2) training the model to be more cautious causes it to decline questions that it can answer correctly; and (3) supervised training misleads the model because the ideal answer depends on what the model knows, rather than what the human demonstrator knows. https://openai.com/blog/chatgpt/