关于“php_汉字unicode编码”的问题,小编就整理了【3】个相关介绍“php_汉字unicode编码”的解答:
汉字编码方法?步骤/方式1
第一种编码方法是GB。
GB2312字集是简体字集, 共包括国标简体汉字6763个。GB12345是与GB2312对应的国标繁体字符集,其码与GB2312中简体汉字码相兼容内,仅字型有简、繁容体的区别,共计6,866字。特点:系统内会把简体汉字转成繁体汉字,但是繁体字不能转换为简体字。
步骤/方式2
第二种编码方法是BIG5
BIG5字集是台湾繁体字集,共包括国标繁体汉字13053个。特点:系统内只认识繁体不识别简体。
步骤/方式3
第三种编码方法是GBK
GBK字集是简繁字集, 包括了GB字集, BIG5字集和一些符号, 共包括21003个字符。特点:使用了双字节编码方案,GBK格式的字体都比较大,它包含了所有简体和繁体汉字。
步骤/方式4
第四种编码方法是Unicode
Unicode也是一种字符编码方法, 由国际组织设计, 可以容纳全世界所有语言文字的编码方案。ASCII, GB2312, GBK到GB18030的编码方法是向下兼容的。而Unicode只与ASCII兼容, 与GB码不兼容。例如:"汉"字的Unicode编码是6C49, 而GB码是BABA。
步骤/方式5
第五种编码方法是UTF
计算机常用的信息编码有哪几种?在计算机硬件中,编码(coding)是在一个主题或单元上为数据存储,管理和分析的目的而转换信息为编码值(典型的如数字)的过程。在软件中,编码意味着逻辑地使用一个特定的语言如C或C++来执行一个程序字符编码:使用二进制数对字符进行的编码称字符编码。ASCII码:美国标准信息交换码的英文简称,是计算机中用二进制表示字母、数字、符号的一种编码标准。ASCII码有两种,使用7位二进制数的称为基本ASCII码;使用8位二进制数的称为扩展ASCII码。汉字编码:用于表示汉字字符的二进制字符编码。汉字编码根据其用途不同可分为输入码、内部码、字型码和地址码等。
计算机常用的编码有:ASCII码,汉字编码等
字符编码就是以二进制的数字来对应字符集的字符,目前用得最普遍的字符集是ANSI,对应ANSI字符集的二进制编码就称为ANSI码,DOS和Windows系统都使用了ANSI码,但在系统中使用的字符编码要经过二进制转换,称为系统内码。
汉字进入计算机的三种途径:
①机器自动识别汉字:计算机通过“视觉”装置(光学字符阅读器或其他),用光电扫描等方法识别汉字。
②通过语音识别输入:计算机利用人们给它配备的“听觉器官”,自动辨别汉语语音要素,从不同的音节中找出不同的汉字,或从相同音节中判断出不同汉字。
③通过汉字编码输入:根据一定的编码方法,由人借助输入设备将汉字输入计算机。
unicode编码怎么转换成中文显示?unicode编码不需要转换成汉字,因为unicode就是和字符关联的终极编码。
windows中只有unicode码可以和字符直接关联,也就是使用国际标准的unicode字符集。
中文windowsXp默认的内码是gbk(装过gb18030补丁的话也就变成gb18030),日文系统就是JIS,不同语言版本的windows都有不同的默认内码,这是每个国家的标准化管理局规定的。
然后就是页码表的概念,所谓页码表就是把一个用系统默认编码(比如gbk,gb2312)表示的字符映射到对应unicode编码,而每个unicode编码对应着唯一确定的字符。这样就完成了地域性编码到国际标准码再到字符的对应关系。
在控制面板->区域和语言选择->高级,里面可以看到window提供的所有页码表。
绝非转载,无参考内容,均为个人理解参悟内容。
到此,以上就是小编对于“php_汉字unicode编码”的问题就介绍到这了,希望介绍关于“php_汉字unicode编码”的【3】点解答对大家有用。