• 售前

  • 售后

热门帖子
入门百科

UTF8转成GB2312乱码题目办理方案

[复制链接]
幸福341 显示全部楼层 发表于 2021-8-19 18:53:19 |阅读模式 打印 上一主题 下一主题
最近做了一个小项目,遇到此类题目,记录一下,也算是一个总结。
此项目分为两部分,一个是消息数据收罗,一个是收罗信息的考核,末了生成XML文件。

数据收罗后的数据经过用户编辑完之后,要导出一个ACCESS文件,然后把这个文件导入到信息考核系统。在ACCESS库中存储消息信息的字段范例是ntext范例,而考核系统库中对应的是varchar(max)范例的字段,导入之后,发现有的空缺字符会出现乱码,体现为问号(?),其实经过反面的测试,这不是空缺(空格)字符,而一个特殊字符,怎么办?经过几番测试后发现,varchar(max)范例要改成nvarchar(max)范例,如许导入的数据就不会再有此类题目了。

但反面的测试过程中,又会发现对导入后的收罗信息更改(通过.net程序编辑功能)后,数据库中此条信息又出现了乱码题目,研究后发现在插入语句中如许写就不会出现此类题目了,如insert into 表名 (news)values(N'"+更新后的值+""),为什么加N?去百度一下就明确了。

到此,心中总算得到安慰,但反面的题目又让人陷入郁闷之中。。。。。。
考核完的信息要生成XML范例的文件,而且XML要采用GB2312编码,由于收罗的消息网站,有很多网站采用的是UTF8编码,如许在转化的过程中又出现乱码(还是谁人“空缺”特殊字符搞的),怎么办?网上先容的把UTF8转化成GB2312就可以了,但实际发现,还是解决不了题目,这下弄的一上午为了解决这个题目,末了还是没有办法,正郁闷之时,突然想到通过VS的调试功能来看看这个特殊字符究竟是什么玩意,末了通过把数据库的此字段值读取出来之后,然后转化成字符数组,content.ToCharArray(); 一个一个的看,发现,导致乱码的这个字符是' '注意引号中的空缺,这不是一个空格,而是一个在GB2312中无法辨认的特殊字符,此时突然想到,能不能把这个字符的值直接用空格替换呢?立刻举措,果然,解决了乱码题目。真求郁闷,这一个毛玩意浪费了一半天时间。

注意,必须要用调试出来的这个值(由于这才是真正的导致乱码的谁人特殊字符),调试的时间在即使窗体中粘贴。
复制代码 代码如下:
content = content.Replace(" ", " ");

帖子地址: 

回复

使用道具 举报

分享
推广
火星云矿 | 预约S19Pro,享500抵1000!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

草根技术分享(草根吧)是全球知名中文IT技术交流平台,创建于2021年,包含原创博客、精品问答、职业培训、技术社区、资源下载等产品服务,提供原创、优质、完整内容的专业IT技术开发社区。
  • 官方手机版

  • 微信公众号

  • 商务合作