解决XMLHTTP对象返回编码问题的方法

解决XMLHTTP对象返回编码问题的方法

第一种,我原先的办法。
在服务器端加上UTF-8编码说明:

解决XMLHTTP对象返回编码问题的方法<%@LANGUAGE="VBSCRIPT"CODEPAGE="65001"%>
解决XMLHTTP对象返回编码问题的方法<%Response.Charset="UTF-8"%>
解决XMLHTTP对象返回编码问题的方法<%'Response.CodePage=65001%>
解决XMLHTTP对象返回编码问题的方法<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

其中上述代码中的第三行,被我加了注释。这是由于,在2003所带的IIS6当中,不支持这条命令。所以麻烦就来了:在本地用XP调试程序,就得把这条注释去掉,在上传到2003服务器上之前还得再把注释加上。

第二种:直接在服务器端加上GB2312的编码说明,但是经过我的测试(本机XP sp2 中文版),未通过。但是我也把它记录下来,也许哪天还能用得上。

PHP:header('Content-Type:text/html;charset=GB2312');
ASP:Response.Charset("GB2312")
JSP:response.setHeader("Charset","GB2312");

第三种:使用自定义函数进行编码转换。

方法一:

解决XMLHTTP对象返回编码问题的方法解决XMLHTTP对象返回编码问题的方法functiongb2utf8(data){
解决XMLHTTP对象返回编码问题的方法
varglbEncode=[];
解决XMLHTTP对象返回编码问题的方法gb2utf8_data
=data;
解决XMLHTTP对象返回编码问题的方法execScript(
"gb2utf8_data=MidB(gb2utf8_data,1)","VBScript");
解决XMLHTTP对象返回编码问题的方法解决XMLHTTP对象返回编码问题的方法
vart=escape(gb2utf8_data).replace(/%u/g,"").replace(/(.{2})(.{2})/g,"%$2%$1").replace(/%([A-Z].)%(.{2})/g,"@$1$2");
解决XMLHTTP对象返回编码问题的方法t
=t.split("@");
解决XMLHTTP对象返回编码问题的方法
vari=0,j=t.length,k;
解决XMLHTTP对象返回编码问题的方法解决XMLHTTP对象返回编码问题的方法
while(++i<j){
解决XMLHTTP对象返回编码问题的方法k
=t[i].substring(0,4);
解决XMLHTTP对象返回编码问题的方法
if(!glbEncode[k])
解决XMLHTTP对象返回编码问题的方法解决XMLHTTP对象返回编码问题的方法
{
解决XMLHTTP对象返回编码问题的方法gb2utf8_char
=eval("0x"+k);
解决XMLHTTP对象返回编码问题的方法execScript(
"gb2utf8_char=Chr(gb2utf8_char)","VBScript");
解决XMLHTTP对象返回编码问题的方法glbEncode[k]
=escape(gb2utf8_char).substring(1,6);
解决XMLHTTP对象返回编码问题的方法}

解决XMLHTTP对象返回编码问题的方法t[i]=glbEncode[k]+t[i].substring(4);
解决XMLHTTP对象返回编码问题的方法}

解决XMLHTTP对象返回编码问题的方法gb2utf8_data=gb2utf8_char=null;
解决XMLHTTP对象返回编码问题的方法
returnunescape(t.join("%"));
解决XMLHTTP对象返回编码问题的方法}

使用时:xxx.innerHTML=gb2utf8(req.responseBody);

方法二.

解决XMLHTTP对象返回编码问题的方法Functionbytes2BSTR_GB2312(vIn)
解决XMLHTTP对象返回编码问题的方法strReturn
=""
解决XMLHTTP对象返回编码问题的方法Fori=1ToLenB(vIn)
解决XMLHTTP对象返回编码问题的方法ThisCharCode
=AscB(MidB(vIn,i,1))
解决XMLHTTP对象返回编码问题的方法
IfThisCharCode<&H80Then
解决XMLHTTP对象返回编码问题的方法strReturn=strReturn&Chr(ThisCharCode)
解决XMLHTTP对象返回编码问题的方法
Else
解决XMLHTTP对象返回编码问题的方法NextCharCode=AscB(MidB(vIn,i+1,1))
解决XMLHTTP对象返回编码问题的方法strReturn
=strReturn&Chr(CLng(ThisCharCode)*&H100+CInt(NextCharCode))
解决XMLHTTP对象返回编码问题的方法i
=i+1
解决XMLHTTP对象返回编码问题的方法EndIf
解决XMLHTTP对象返回编码问题的方法Next
解决XMLHTTP对象返回编码问题的方法bytes2BSTR_GB2312=strReturn
解决XMLHTTP对象返回编码问题的方法
EndFunction

方法三:

解决XMLHTTP对象返回编码问题的方法<scriptlanguage="JavaScript">
解决XMLHTTP对象返回编码问题的方法<!--
解决XMLHTTP对象返回编码问题的方法解决XMLHTTP对象返回编码问题的方法functionutf8(wide){
解决XMLHTTP对象返回编码问题的方法
varc,s;
解决XMLHTTP对象返回编码问题的方法
varenc="";
解决XMLHTTP对象返回编码问题的方法
vari=0;
解决XMLHTTP对象返回编码问题的方法解决XMLHTTP对象返回编码问题的方法
while(i<wide.length){
解决XMLHTTP对象返回编码问题的方法c
=wide.charCodeAt(i++);
解决XMLHTTP对象返回编码问题的方法
//handleUTF-16surrogates
解决XMLHTTP对象返回编码问题的方法if(c>=0xDC00&&c<0xE000)continue;
解决XMLHTTP对象返回编码问题的方法解决XMLHTTP对象返回编码问题的方法
if(c>=0xD800&&c<0xDC00){
解决XMLHTTP对象返回编码问题的方法
if(i>=wide.length)continue;
解决XMLHTTP对象返回编码问题的方法s
=wide.charCodeAt(i++);
解决XMLHTTP对象返回编码问题的方法
if(s<0xDC00||c>=0xDE00)continue;
解决XMLHTTP对象返回编码问题的方法c
=((c-0xD800)<<10)+(s-0xDC00)+0x10000;
解决XMLHTTP对象返回编码问题的方法}

解决XMLHTTP对象返回编码问题的方法//outputvalue
解决XMLHTTP对象返回编码问题的方法if(c<0x80)enc+=String.fromCharCode(c);
解决XMLHTTP对象返回编码问题的方法
elseif(c<0x800)enc+=String.fromCharCode(0xC0+(c>>6),0x80+(c&0x3F));
解决XMLHTTP对象返回编码问题的方法
elseif(c<0x10000)enc+=String.fromCharCode(0xE0+(c>>12),0x80+(c>>6&0x3F),0x80+(c&0x3F));
解决XMLHTTP对象返回编码问题的方法
elseenc+=String.fromCharCode(0xF0+(c>>18),0x80+(c>>12&0x3F),0x80+(c>>6&0x3F),0x80+(c&0x3F));
解决XMLHTTP对象返回编码问题的方法}

解决XMLHTTP对象返回编码问题的方法returnenc;
解决XMLHTTP对象返回编码问题的方法}

解决XMLHTTP对象返回编码问题的方法varhexchars="0123456789ABCDEF";
解决XMLHTTP对象返回编码问题的方法解决XMLHTTP对象返回编码问题的方法
functiontoHex(n){
解决XMLHTTP对象返回编码问题的方法
returnhexchars.charAt(n>>4)+hexchars.charAt(n&0xF);
解决XMLHTTP对象返回编码问题的方法}

解决XMLHTTP对象返回编码问题的方法varokURIchars="ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789_-";
解决XMLHTTP对象返回编码问题的方法解决XMLHTTP对象返回编码问题的方法
functionencodeURIComponentNew(s){
解决XMLHTTP对象返回编码问题的方法
vars=utf8(s);
解决XMLHTTP对象返回编码问题的方法
varc;
解决XMLHTTP对象返回编码问题的方法
varenc="";
解决XMLHTTP对象返回编码问题的方法解决XMLHTTP对象返回编码问题的方法
for(vari=0;i<s.length;i++){
解决XMLHTTP对象返回编码问题的方法
if(okURIchars.indexOf(s.charAt(i))==-1)
解决XMLHTTP对象返回编码问题的方法enc
+="%"+toHex(s.charCodeAt(i));
解决XMLHTTP对象返回编码问题的方法
else
解决XMLHTTP对象返回编码问题的方法enc+=s.charAt(i);
解决XMLHTTP对象返回编码问题的方法}

解决XMLHTTP对象返回编码问题的方法returnenc;
解决XMLHTTP对象返回编码问题的方法}

解决XMLHTTP对象返回编码问题的方法alert(encodeURIComponentNew("中文"))
解决XMLHTTP对象返回编码问题的方法alert(decodeURIComponent(encodeURIComponentNew(
"中文")))
解决XMLHTTP对象返回编码问题的方法
//-->
解决XMLHTTP对象返回编码问题的方法</script>

 

第四种:在发送请求的时候提供编码,这种办法需要区分浏览器,所以我没有测试和采纳。但是也把它给摘录下来。(源文地址:http://blog.csdn.net/bailove/archive/2006/05/26/756365.aspx)

XMLHttpRequest读取中文网页时返回乱码的解决办法 解决XMLHTTP对象返回编码问题的方法

XMLHttpRequest 默认是用UTF-8 传递数据。当服务端的返回数据是UTF-8编码的时候,它工作得很好(开发web应用,当服务端和客户端以及数据库统一使用UTF-8编码可以有效的避免乱码问题)。如果服务端设置了正确的Content-Type Response Header以及编码信息,那么XmlHttpRequest也可以正确工作。

可是当使用XMLHttpRequest读取中文网页内容时, 如果服务端的程序没有设置Content-Type Response Header,或者Header没有设置编码类型,那么我们访问responseText属性的时候就可能遭遇乱码。如以下代码用XMLHttpRequest获取雅虎中国网站的星座站首页:

xmlhttp = getXMLHttpRequest();var url = "http://cn.astrology.yahoo.com/";xmlhttp.open("GET", url, true);xmlhttp.onreadystatechange = function(){if (xmlhttp.readyState == 4)  if (xmlhttp.status == 200)    alert(xmlhttp.responseText);};xmlhttp.send(null);

纵使yahoo中国这样专业的网站,对web标准的支持还很不彻底,弹出的html源码中充斥不符合web标准的html标签,当然还有已预见的乱码。

同样遗憾的是,FireFox 和 IE 的解决方法也是南辕北辙

FireFox

FireFox 的XMLHttpRequest对象支持overrideMimeType方法,可以指定返回数据的编码类型,利用该方法可以解决中文乱码,前面的代码修改如下:

xmlhttp = getXMLHttpRequest();var url = "http://cn.astrology.yahoo.com/";xmlhttp.open("GET", url, true);xmlhttp.overrideMimeType("text/html;charset=gb2312");//设定以gb2312编码识别数据xmlhttp.onreadystatechange = function(){if (xmlhttp.readyState == 4)  if (xmlhttp.status == 200)    alert(xmlhttp.responseText);};xmlhttp.send(null);

Internet Explorer

IE不支持overrideMimeType方法,并且只能用一种很蹩脚的方法来解决,此时需要引入一个杂交的函数:

function gb2utf8(data){var glbEncode = [];gb2utf8_data = data;execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript");var t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(.{2})(.{2})/g,"%$2%$1").replace(/%([A-Z].)%(.{2})/g,"@$1$2");t=t.split("@");var i=0,j=t.length,k;while(++i<j) {k=t[i].substring(0,4);if(!glbEncode[k]) {gb2utf8_char = eval("0x"+k);execScript("gb2utf8_char = Chr(gb2utf8_char)", "VBScript");glbEncode[k]=escape(gb2utf8_char).substring(1,6);}t[i]=glbEncode[k]+t[i].substring(4);}gb2utf8_data = gb2utf8_char = null;return unescape(t.join("%"));}

xmlhttp = getXMLHttpRequest();var url = "http://cn.astrology.yahoo.com/";xmlhttp.open("GET", url, true);xmlhttp.onreadystatechange = function(){if (xmlhttp.readyState == 4) if (xmlhttp.status == 200) alert(gb2utf8(xmlhttp.responseBody)); //注意这里要用responseBody};xmlhttp.send(null);

gb2utf8函数直接解析XMLHttpRequest返回的二进制数据,其中要利用execScript方法来执行VBScript的函数。所以说是一个杂交的函数。感谢解决XMLHTTP对象返回编码问题的方法blueidea论坛 提供的算法。

虽然有了解决的办法,但形式丑陋,而且不符合web标准。所以应该在编程中尽量避免,如果是开发web应用,应尽量使用UTF-8编码,或者在服务端设置正确的编码信息。至于以上范例,有盗取其他网站内容的嫌疑,更是不为提倡。