开发背景
目前很多网页编辑器在文本编辑的时候都会智能提示,是否有错别字。在大家常用的文本编辑软件office与wps中,office只会对英文单词进行检测,而wps作为一款国产中文软件,并没有内置中文纠错。既然目前找不到合适的中文纠错软件,那就自己写一个吧。
准备工作
下面我将使用NLP技术对文本进行纠错,为了减少AI部分代码,下面将使用百度现成的api进行AI纠错。
- 注册百度AI开发平台账号(可以使用百度账号直接注册登录)
- 进入NLP SDK文档https://ai.baidu.com/ai-doc/NLP/tk6z52b9z
- 登录控制台,选择自然语言处理,选择创建应用
- 随便输入一个应用名,随便写一个应用描述,立即创建,返回应用列表。
- 纪录下你的app_id, api_key, secret_key
开始工作
- 使用sdk提供的ecnet函数,可以对文本进行纠错
from aip import AipNlp client = AipNlp(app_id, api_key, secret_key) result = client.ecnet(text1)
- 使用python-docx输出错误报告对比,错误字体颜色标红
from docx import Document from docx.shared import RGBColor
- 使用PysimpleGUI给你的python文件封装一个用户界面。
具体代码已经开源到GitHub。
https://github.com/Tlntin/text_ai_analyse
演示视频
演示视频
https://www.ixigua.com/i6819083356483879431/
界面展示:
支持的功能
- 保存api相关信息到本地
- 加载api文件到输入框
- 按中文句号“。”,中文分号“;”进行分句
- 输出word对比报告
后期将会支持的功能
- 直接输出AI分析结果到原文件批注
- 直接将结果替换原文件,并且显示修订记录
- 使用C#重新编译成office/wps插件,集成到办公软件中
- 使用NLP技术在本地进行纠错,用户可以选择在线纠错与离线纠错
- 集成多家AI技术,提高NLP纠错正确率
- 自动生成摘要与总结
- 根据xmind框架自动生成文章。
- 未完待续。。。。