Excel宏与搜狗拼音输入法的探索与实践

2023-01-30 版权声明 我要投稿

1 搜狗拼音的自定义短语

搜狗拼音输入法适应语言的发展, 研究网民的用词习惯、宽容的吸纳并接受互联网新生事物, 并以此调整输入法词频及中文处理的算法, 方便用户使用。搜狗输入法的自定义短语功能是通过特定字符串来输入自定义好的文本, 可以通过输入框的拼音串上的“添加短语”, 或者候选项中的短语项的“编辑短语”来进行短语的添加、编辑和删除, 也可在设置属性选项的高级选项卡中, 进入直接编辑配置文件, 将用户自定义好的符合搜狗输入法规则的短语复制到phrases.ini文件中。

设置自定义短语可以提高输入效率, 例如使用“sfz, 1=370723197511294935”自定义短语, 输入“sfz”, 然后按下空格就可以输入370723197511294935。

2 Excel宏

宏是一组指令集, 通过执行类似批处理的一组命令完成某种功能, 是使用V B Script指令集 (VB编程语言子集) 编写的针对Microsoft Office组件的小程序。Office组件都支持宏 (Macro) 的操作, 利用宏, 可以完成很多系统原本并不支持的特殊应用, 比如完成特殊的数据计算或文档特殊格式的排版等。

3 自定义短语的外码编码

在如下学生信息表中, 若使用拼音作为用户自定义短语的外码, 则会出现重码, 不但学生信息表中有重码, 而且与搜狗输入法系统内部有重码 (如lxy:流星雨, hxm:好羡慕) 。

(1) 外码编码规则:为消除拼音重码, 对拼音字段加上识别码, 重新编码。

如图1所示。

(2) 识别码:对拼音重码者使用26个英文字母重新顺序编码作为识别码。即拼音为“lxy”的第一条记录外码重定义为“lxy aa a”, 第二条为“lxy aa b”, 依次类推。

(3) 字符串常量:有意加长外码长度, 使生成的新外码不与搜狗内部重码, 值由用户自己确定。

(4) 说明:本信息表中的重码数不超过26个, 若超过26, 需要用两位字母编码识别。

4 编写运行Excel宏生成新外码

5 生成同一行数据的重码

利用重码现象将同一行学生信息数据共用一个外码, 利用Excel公式功能生成符合搜狗拼音输入法自定短语规则的用户词句, 公式见表2。实现后的效果见图2。

摘要:搜狗拼音输入法的自定义短语与细胞词库是为满足用户的个性化输入需求而提供的重要功能, 自定义短语是通过特定字符串来输入自定义好的文本, 本文研究如何在Microsoft Excel中通过宏功能实现对用户已有的数据信息批处理定义外码, 实现用户词句的高效录入。

关键词:搜狗拼音,外码,Excel,公式,宏

上一篇:高中英语作文指导摭谈下一篇:新生儿缺氧缺血性脑病临床分析