python获取一组汉字拼音首字母的方法

2025-02-07 版权声明 我要投稿

python获取一组汉字拼音首字母的方法(精选2篇)

python获取一组汉字拼音首字母的方法 篇1

这篇文章主要介绍了python获取一组汉字拼音首字母的方法,涉及Python针对汉字操作的相关技巧,需要的朋友可以参考下

本文实例讲述了python获取一组汉字拼音首字母的方法,分享给大家供大家参考。具体实现方法如下:

#!/usr/bin/env python # -*- coding: utf-8 -*- def multi_get_letter(str_input): if isinstance(str_input, unicode): unicode_str = str_input else: try: unicode_str = str_input.decode(‘utf8‘) except: try: unicode_str = str_input.decode(‘gbk‘) except: print ‘unknown coding‘ return return_list = [] for one_unicode in unicode_str: return_list.append(single_get_first(one_unicode)) return return_list def single_get_first(unicode1): str1 = unicode1.encode(‘gbk‘) try: ord(str1) return str1 except: asc = ord(str1[0]) * 256 + ord(str1[1]) - 65536 if asc >= -20319 and asc <= -20284: return ‘a‘ if asc >= -20283 and asc <= -19776: return ‘b‘ if asc >= -19775 and asc <= -19219: return ‘c‘ if asc >= -19218 and asc <= -18711: return ‘d‘ if asc >= -18710 and asc <= -18527: return ‘e‘ if asc >= -18526 and asc <= -18240: return ‘f‘ if asc >= -18239 and asc <= -17923: return ‘g‘ if asc >= -17922 and asc <= -17418: return ‘h‘ if asc >= -17417 and asc <= -16475: return ‘j‘ if asc >= -16474 and asc <= -16213: return ‘k‘ if asc >= -16212 and asc <= -15641: return ‘l‘ if asc >= -15640 and asc <= -15166: return ‘m‘ if asc >= -15165 and asc <= -14923: return ‘n‘ if asc >= -14922 and asc <= -14915: return ‘o‘ if asc >= -14914 and asc <= -14631: return ‘p‘ if asc >= -14630 and asc <= -14150: return ‘q‘ if asc >= -14149 and asc <= -14091: return ‘r‘ if asc >= -14090 and asc <= -13119: return ‘s‘ if asc >= -13118 and asc <= -12839: return ‘t‘ if asc >= -12838 and asc <= -12557: return ‘w‘ if asc >= -12556 and asc <= -11848: return ‘x‘ if asc >= -11847 and asc <= -11056: return ‘y‘ if asc >= -11055 and asc <= -10247: return ‘z‘ return ‘‘ def main(str_input): a = multi_get_letter(str_input) b = ‘‘ for i in a: b= b+i print b if __name__ == “__main__”: str_input=u‘欢迎你‘ main(str_input)

python获取一组汉字拼音首字母的方法 篇2

一、实现原理

汉字在计算机中的处理, 以GB2312-80 (《信息交换用汉字编码字符集·基本集》) 标准为基础。

GB 2312-80标准共收录6763个汉字, 其中一级汉字3755个, 二级汉字3008个;同时收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个字符。

GB2312中对所收汉字进行了“分区”处理, 每区含有94个汉字/符号。这种表示方式也称为区位码。01-09区为特殊符号。16-55区为一级汉字, 按拼音排序。56-87区为二级汉字, 按部首笔画排序。10-15区及88-94区保留。

一级汉字由于按拼音排序, 它的转换比较简单, 可以通过确定汉字处于哪一个区间, 转换为相应的拼音首字母。二级汉字是按字母笔画排序, 它的转换可通过在程序中查表来实现, 但首先要做好二级汉字拼音首字母表。

二、实现方法

三、结束语

本文的程序在PB9.0下调试通过, 应用于我院财务收费系统中, 能转换GB2312-80中的一二级汉字。

参考文献

[1]李勇等编著.Power Builder8.0彻底研究.北京:中国铁道出版社.

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:iwenmi@163.com

上一篇:“做党的忠诚卫士,当群众的贴心人”总结下一篇:六年级上册第七单元习作400字——保护动物

付费复制
文书易10年专业运营,值得您的信赖

限时特价:7.9元/篇

原价:20元
微信支付
已付款请点这里联系客服
欢迎使用微信支付
扫一扫微信支付
微信支付:
支付成功
已获得文章复制权限
确定
常见问题