• 售前

  • 售后

热门帖子
入门百科

整理HTML5中支持的URL编码与字符编码

[复制链接]
123457751 显示全部楼层 发表于 2021-10-26 14:21:12 |阅读模式 打印 上一主题 下一主题
URL 编码
URL 编码就是将 URLs 中不宜打印的字符大概具有特殊意义的字符转换为 Web 浏览器和服务器明白且广泛担当的表示法。 这些字符包罗:
ASCII 控制字符 - 不宜打印的字符通常用于输出控制。字符范围是十六进制的 00-1F(十进制的 0-31)和 7F(十进制的 127)。下面提供了完备的编码表。
非 ASCII 控制字符 - 这些字符超出了 128 个 ASCII 字符集的范围。这个范围是 ISO-拉丁字符集的一部分以及包罗整个十六进制的 ISO-拉丁字符集 00-FF (十进制的 128-255)的“前半部分”。下面提供了完备的编码表。
保存字符 - 诸如美元符号,和号,加号,通用符号,正斜杠,冒号,分好,等号,问号以及 “at”这类符号。全部这些符号在 URL 内都有差别的意义,因此必要编码。下面提供了完备的编码表。
不安全字符 - 包罗空格,问号,小于符号,大于符号,磅字符,百分比符号,大括号左边部分,大括号右边部分,管道符,反斜杠,插入符号,波浪线。左方括号,右方括号,沉音符。出于某些缘故原由,这些字符出如今 URLs 中存在被误解的可能性。这些字符也应该始终被编码。下面提供了完备的编码表。
编码表示法必要三个字符更换期望的字符:一个百分号,两个在 ASCII 字符集中表示字符位置的十六进制数字、
示例
最常见的特殊字符之一便是空格。我们不能在 URL 中直接输入一个空格。空格在字符集中就是十六进制的 20。因此请求服务器时可以使用 %20 表示空格。

复制代码代码如下:http://www.example.com/new%20pricing.html
这个 URL 实际上是从 www.example.com 检索一个名为 new pricing.html 的文档。
ASCII 控制字符编码
包罗十六进制的 00-1F(十进制的 0-31)和 7F(十进制的 127)字符码。

            十进制格式             十六进制值             字符             URL 编码                             0             00                         %00                             1             01                         %01                             2             02                         %02                             3             03                         %03                             4             04                         %04                             5             05                         %05                             6             06                         %06                             7             07                         %07                             8             08             退格符             %08                             9             09             tab             %09                             10             0a             换行符             %0a                             11             0b                         %0b                             12             0c                         %0c                             13             0d             回车符             %0d                             14             0e                         %0e                             15             0f                         %0f                             16             10                         %10                             17             11                         %11                             18             12                         %12                             19             13                         %13                             20             14                         %14                             21             15                         %15                             22             16                         %16                             23             17                         %17                             24             18                         %18                             25             19                         %19                             26             1a                         %1a                             27             1b                         %1b                             28             1c                         %1c                             29             1d                         %1d                             30             1e                         %1e                             31             1f                         %1f                             127             7f                         %7f         
非 ASCII 控制字符编码
包罗整个十六进制的 ISO-拉丁字符集 80-FF(十进制的 128-255)编码的“前半部分”。
            十进制格式             十六进制值             字符             URL 编码                             128             80             €             %80                             129             81             ?             %81                             130             82             ?             %82                             131             83             ?             %83                             132             84             ?             %84                             133             85             …             %85                             134             86             ?             %86                             135             87             ?             %87                             136             88             ?             %88                             137             89             ‰             %89                             138             8a             ?             %8a                             139             8b             ?             %8b                             140             8c             ?             %8c                             141             8d             ?             %8d                             142             8e             ?             %8e                             143             8f             ?             %8f                             144             90             ?             %90                             145             91             ‘             %91                             146             92             ’             %92                             147             93             “             %93                             148             94             ”             %94                             149             95             ?             %95                             150             96             –             %96                             151             97             —             %97                             152             98             ?             %98                             153             99             ?             %99                             154             9a             ?             %9a                             155             9b             ?             %9b                             156             9c             ?             %9c                             157             9d             ?             %9d                             158             9e             ?             %9e                             159             9f             ?             %9f                             160             a0                         %a0                             161             a1             ?             %a1                             162             a2             ¢             %a2                             163             a3             £             %a3                             164             a4             ¤             %a4                             165             a5             ¥             %a5                             166             a6             |             %a6                             167             a7             §             %a7                             168             a8             ¨             %a8                             169             a9             ?             %a9                             170             aa             a             %aa                             171             ab             ?             %ab                             172             ac             ?             %ac                             173             ad             -             %ad                             174             ae             ?             %ae                             175             af             ˉ             %af                             176             b0             °             %b0                             177             b1             ±             %b1                             178             b2             2             %b2                             179             b3             3             %b3                             180             b4             ′             %b4                             181             b5             μ             %b5                             182             b6             ?             %b6                             183             b7             ·             %b7                             184             b8             ?             %b8                             185             b9             1             %b9                             186             ba             o             %ba                             187             bb             ?             %bb                             188             bc             ?             %bc                             189             bd             ?             %bd                             190             be             ?             %be                             191             bf             ?             %bf                             192             c0             à             %c0                             193             c1             á             %c1                             194             c2             ?             %c2                             195             c3             ?             %c3                             196             c4             ?             %c4                             197             c5             ?             %c5                             198             c6             ?             %v6                             199             c7             ?             %c7                             200             c8             è             %c8                             201             c9             é             %c9                             202             ca             ê             %ca                             203             cb             ?             %cb                             204             cc             ì             %cc                             205             cd             í             %cd                             206             ce             ?             %ce                             207             cf             ?             %cf                             208             d0             D             %d0                             209             d1             ?             %d1                             210             d2             ò             %d2                             211             d3             ó             %d3                             212             d4             ?             %d4                             213             d5             ?             %d5                             214             d6             ?             %d6                             215             d7             ×             %d7                             216             d8             ?             %d8                             217             d9             ù             %d9                             218             da             ú             %da                             219             db             ?             %db                             220             dc             ü             %dc                             221             dd             Y             %dd                             222             de             T             %de                             223             df             ?             %df                             224             e0             à             %e0                             225             e1             á             %e1                             226             e2             a             %e2                             227             e3             ?             %e3                             228             e4             ?             %e4                             229             e5             ?             %e5                             230             e6             ?             %e6                             231             e7             ?             %e7                             232             e8             è             %e8                             233             e9             é             %e9                             234             ea             ê             %ea                             235             eb             ?             %eb                             236             ec             ì             %ec                             237             ed             í             %ed                             238             ee             ?             %ee                             239             ef             ?             %ef                             240             f0             e             %f0                             241             f1             ?             %f1                             242             f2             ò             %f2                             243             f3             ó             %f3                             244             f4             ?             %f4                             245             f5             ?             %f5                             246             f6             ?             %f6                             247             f7             ÷             %f7                             248             f8             ?             %f8                             249             f9             ù             %f9                             250             fa             ú             %fa                             251             fb             ?             %fb                             252             fc             ü             %fc                             253             fd             y             %fd                             254             fe             t             %fe                             255             ff             ?             %ff         
保存字符编码
下表用于编码保存字符。
            十进制格式             十六进制值             字符             URL 编码                             36             24             $             %24                             38             26             &             %26                             43             2b             +             %2b                             44             2c             ,             %2c                             47             2f             /             %2f                             58             3a             :             %3a                             59             3b             ;             %3b                             61             3d             =             %3d                             63             3f             ?             %3f                             64             40             @             %40         
不安全字符编码
下表用于编码不安全字符。
            十进制格式             十六进制值             字符             URL 编码                             32             20             space             %20                             34             22             "             %22                             60             3c             <             %3c                             62             3e             >             %3e                             35             23             #             %23                             37             25             %             %25                             123             7b             {             %7b                             125             7d             }             %7d                             124             7c             |             %7c                             92             5c             \             %5c                             94             5e             ^             %5e                             126             7e             ~             %7e                             91             5b             [             %5b                             93             5d             ]             %5d                             96             60             `             %60         
字符编码字符编码就是将字节转换为字符的一种方法。要验证大概表现一个 HTML 文档,程序必须选择一个字符编码。HTML5 作者有三种方式设置字符编码:
HTTP Content-Type 头:
假如你在编写 cgi 程序大概类似的程序,那么可以使用 HTTP Content-Type 头设置任意字符编码:
下面是一个简单的例子:
XML/HTML Code复制内容到剪贴板
       
  • print "Content-Type: text/html; charset=utf-8\r\n";  
<meta> 元素:
可以使用带有 charset 属性的 <meta> 元素指定 HTML5 文档前 512 个字节的编码:
下面是简化的例子:
XML/HTML Code复制内容到剪贴板
       
  • <meta charset="UTF-8">  
只管这种语法是被答应的,但上述语法必要使用 <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> 更换。
Unicode 字节序次标记(BOM)
一个字节序次标记(BOM)由数据流开头的 U+FEFF 字符码组成,它可以用作界说字节序次和编码情势的署名,主要是未标记的明文文件。
很多 Windows 程序(包罗 Windows 记事本)都会在保存为 UTF-8 的任意文档开头添加 0xEF, 0xBB, 0xBF。这就是 Unicode 字节序次标记(BOM)的 UTF-8 编码,通常被称为 UTF-8 BOM,只管它和字节序次没有关系。
对于 HTML5 文档,我们可以在文件的开头使用 Unicode 字节序次标记(BOM)字符。这个字符为使用的编码提供了署名。

帖子地址: 

回复

使用道具 举报

分享
推广
火星云矿 | 预约S19Pro,享500抵1000!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

草根技术分享(草根吧)是全球知名中文IT技术交流平台,创建于2021年,包含原创博客、精品问答、职业培训、技术社区、资源下载等产品服务,提供原创、优质、完整内容的专业IT技术开发社区。
  • 官方手机版

  • 微信公众号

  • 商务合作