• 售前

  • 售后

热门帖子
入门百科

WordPress源代码中文乱码的办理方法

[复制链接]
计划你大爷计j 显示全部楼层 发表于 2021-8-15 19:44:50 |阅读模式 打印 上一主题 下一主题
检察相关教程,UTF-8和UTF-8 + BOM有所区别,于是把function.php编码改为后者。题目办理。

UFT-8 与UTF-8 BOM 的区别:(收集过来,我还没看)
UTF-8以字节为编码单元,没有字节序的题目。UTF-16以两个字节为编码单元,在表明一个UTF-16文本前,首先要弄清晰每个编码单元的字节序。例如“奎”的Unicode编码是594E,“乙”的Unicode编码是4E59。如果我们收到UTF-16字节省“594E”,那么这是“奎”还是“乙”?

Unicode规范中推荐的标志字节次序的方法是BOM。BOM是Byte order Mark。BOM是一个有点小聪明的想法:

在UCS编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的编码是FEFF。而FFFE在UCS中是不存在的字符,所以不应该出现在现实传输中。UCS规范建议我们在传输字节省前,先传输字符"ZERO WIDTH NO-BREAK SPACE"。

这样如果接收者收到FEFF,就表明这个字节省是Big-Endian的;如果收到FFFE,就表明这个字节省是Little-Endian的。因此字符"ZERO WIDTH NO-BREAK SPACE"又被称作BOM。

UTF-8不需要BOM来表明字节次序,但可以用BOM来表明编码方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8编码是EF BB BF(读者可以用我们前面介绍的编码方法验证一下)。所以如果接收者收到以EF BB BF开头的字节省,就知道这是UTF-8编码了。

帖子地址: 

回复

使用道具 举报

分享
推广
火星云矿 | 预约S19Pro,享500抵1000!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

草根技术分享(草根吧)是全球知名中文IT技术交流平台,创建于2021年,包含原创博客、精品问答、职业培训、技术社区、资源下载等产品服务,提供原创、优质、完整内容的专业IT技术开发社区。
  • 官方手机版

  • 微信公众号

  • 商务合作