开发背景
目前很多网页编辑器在文本编辑的时候都会智能提示,是否有错别字 。在大家常用的文本编辑软件office与wps中,office只会对英文单词进行检测,而wps作为一款国产中文软件,并没有内置中文纠错 。既然目前找不到合适的中文纠错软件 , 那就自己写一个吧 。准备工作
下面我将使用NLP技术对文本进行纠错,为了减少AI部分代码 , 下面将使用百度现成的api进行AI纠错 。- 注册百度AI开发平台账号(可以使用百度账号直接注册登录)
- 进入NLP SDK文档https://ai.baidu.com/ai-doc/NLP/tk6z52b9z
- 登录控制台,选择自然语言处理,选择创建应用
- 随便输入一个应用名,随便写一个应用描述 , 立即创建,返回应用列表 。
- 纪录下你的app_id, api_key, secret_key
开始工作
- 使用sdk提供的ecnet函数,可以对文本进行纠错
from aip import AipNlpclient = AipNlp(app_id, api_key, secret_key)result = client.ecnet(text1)
- 使用python-docx输出错误报告对比,错误字体颜色标红
from docx import Documentfrom docx.shared import RGBColor
- 使用PysimpleGUI给你的python文件封装一个用户界面 。
https://github.com/Tlntin/text_ai_analyse
演示视频
https://www.ixigua.com/i6819083356483879431/界面展示:
支持的功能
- 保存api相关信息到本地
- 加载api文件到输入框
- 按中文句号“ 。”,中文分号“;”进行分句
- 输出word对比报告
后期将会支持的功能
- 直接输出AI分析结果到原文件批注
- 直接将结果替换原文件,并且显示修订记录
- 使用C#重新编译成office/wps插件 , 集成到办公软件中
- 使用NLP技术在本地进行纠错 , 用户可以选择在线纠错与离线纠错
- 集成多家AI技术,提高NLP纠错正确率
- 自动生成摘要与总结
- 根据xmind框架自动生成文章 。
- 未完待续 。。。。