Tag: 编码预览模式: 普通 | 列表
  做网站的人都知道Server.UrlEncode函数,不过,网站做多了就会接触到gb2312和utf-8这两种不同的网页编码。网页编码只是最后形成的网页中对字符怎样编码,在网页形成的过程中还对应着不同的编码方案。一般而言,如果做的网页是gb2312的,那么ASP的CODEPAGE是936,而utf-8则是650001。
  UrlEncode虽然并不直接将汉字转化为内码,但与内码有着对应关系,就同样的汉字,比如“一级棒”,在CODEPAGE=936时被转化为“%D2%BB%BC%B6%B0%F4”,而CODEPAGE=65001时被转化为“%E4%B8%80%E7%BA%A7%E6%A3%92”。它们分别就对应了“一级棒”三字的GB码和utf-8码(utf-8码与UNICODE码有一一对应的关系)。
  在ASP中有两个函数可以分别获取汉字的GB和UNICODE这两种编码,它们分别是“Asc()”和“Ascw()”函数,不过这里要强列说明的是,在CODEPAGE=65001时“Asc()”函数会对双字节字符失效。
  下面就拿“一级棒”的“级”字为例,它的GB码为48310(-17226 + 65536)、UNICODE码为32423,转化为16进制,就分别为BCB6和7EA7。其中GB码的十六进制表示一眼就看出来,跟UrlEncode的结果是一致的,所以下面就只要谈谈utf-8了。
  进六进制7EA7在“0000 0800-0000 FFFF”范围内,对应的utf-8码为三字节。先将7EA7转化为二进制01111110 10100111,然后重新分段:0111 111010 100111,套用“1110xxxx 10xxxxxx 10xxxxxx”模板后得到11100111 10111010 10100111,就得到了E7 BA A7。再看一下UrlEncode的结果是否相符?
  如果要自己写UrlEncode或UrlDecode函数,则可以跟据以上这些规则来实现,下面先列出算法,然后再来讨论是否有必要写这样的函数。(友情提醒:为了排版效果,本站使用两个全角空格来代替一个Tab,如果要验证以下函数,请自行进行替换。)
Function MyUrlEncodeGB(char)
  Dim code, codeh, codel
  code = "0000" & Hex(Asc(char))'兼容英文字母与数字
  codel = Right(code, 2)
  codeh = Left(Right(code, 4), 2)

查看更多...

Tags: ASP 代码 编码

分类:技术资料 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 9811

asp写的汉字转换utf-8及utf-8转gb2312的代码

chinese2unicode 为汉字转 UTF-8编码,utf2gb为UTF-8转换为汉字GB2312编码

function chinese2unicode(str)
dim i
dim str_one
dim str_unicode
for i=1 to len(str)
    str_one=mid(str,i,1)
    str_unicode=str_unicode&chr(38)
    str_unicode=str_unicode&chr(35)
    str_unicode=str_unicode&chr(120)

查看更多...

Tags: ASP 代码 编码

分类:技术资料 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 12728
PHP程序中“指定文字转换成UTF-8”及“指定文字转换成GB2312格式”的方法,附代码如下:

  /**
   * gb2utf8 指定的文字转换为UTF-8格式,包括中英文混合
   * $gb 传过来的GB字符,下面的方法类似
   */
  function gb2utf8($gb) {
    if(!trim($gb))
    return $gb;
    $filename="./gb2312.txt";
    $tmp=file($filename);

查看更多...

Tags: PHP 代码 编码

分类:技术资料 | 固定链接 | 评论: 1 | 引用: 0 | 查看次数: 12402
在制作网页的时候,偶尔会出现编码交叉的情况。一段GB2312编码的汉字在UTF-8页面中可能会出现乱码,所以这个时候需要把这段文字转换编码,下面提供转换编码的ASP函数代码供大家参考。
'汉字GB2312编码转换成UTF-8编码
function chinese2unicode(Salon)
  dim i
  dim Salon_one
  dim Salon_unicode
  for i=1 to len(Salon)
      Salon_one=Mid(Salon,i,1)
      Salon_unicode=Salon_unicode&chr(38)
      Salon_unicode=Salon_unicode&chr(35)
      Salon_unicode=Salon_unicode&chr(120)

查看更多...

Tags: ASP 代码 编码

分类:技术资料 | 固定链接 | 评论: 0 | 引用: 0 | 查看次数: 14217