一聚教程网:一个值得你收藏的教程网站

热门教程

php 编码转换-字符编码转换

时间:2022-07-02 09:54:23 编辑:袖梨 来源:一聚教程网

面的两段VB代码分别针对UTF-8(UTF8ENCODEURI)和GB2312(GBKENCODEURI)进行了编码的转换。

    PRIVATE SUB COMMAND1_CLICK()
        DEBUG.PRINT (UTF8ENCODEURI("汉字"))
        DEBUG.PRINT (GBKENCODEURI("汉字"))
    END SUB


    FUNCTION UTF8ENCODEURI(SZINPUT)
        DIM WCH, UCH, SZRET
        DIM X
        DIM NASC, NASC2, NASC3

        IF SZINPUT = "" THEN
            UTF8ENCODEURI = SZINPUT
            EXIT FUNCTION
        END IF

        FOR X = 1 TO LEN(SZINPUT)
            WCH = MID(SZINPUT, X, 1)
            NASC = ASCW(WCH)

            IF NASC < 0 THEN NASC = NASC + 65536

            IF (NASC AND &HFF80) = 0 THEN
                SZRET = SZRET & WCH
            ELSE
                IF (NASC AND &HF000) = 0 THEN
                    UCH = "%" & HEX(((NASC 2 ^ 6)) OR &HC0) & HEX(NASC AND &H3F OR &H80)
                    SZRET = SZRET & UCH
                ELSE
                    UCH = "%" & HEX((NASC 2 ^ 12) OR &HE0) & "%" & _
                    HEX((NASC 2 ^ 6) AND &H3F OR &H80) & "%" & _
                    HEX(NASC AND &H3F OR &H80)
                    SZRET = SZRET & UCH
                END IF
            END IF
        NEXT


iconv() 函数
Definition and Usage
定义和用法
iconv()函数的作用是:转换字符串的编码。

Description
string iconv ( string in_charset, string out_charset, string str )

Tips and Notes
注意点
注意:第二个参数,除了可以指定要转化到的编码以外,还可以增加两个后缀://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 会自动将不能直接转化的字符变成一个或多个近似的字符,//IGNORE 会忽略掉不能转化的字符,而默认效果是从第一个非法字符截断。

mb_convert_encoding() 函数
Definition and Usage
定义和用法
mb_convert_encoding()函数的作用是:转换字符串的编码。

Description
string mb_convert_encoding ( string str, string to-encoding [, mixed from-encoding])

注意:但是需要先enable mbstring 扩展库。
两者区别:mb_convert_encoding 中根据内容自动识别编码;mb_convert_encoding功能强大,但是执行效率比iconv差太多;

总结:一般情况下用 iconv,只有当遇到无法确定原编码是何种编码时才用 mb_convert_encoding 函数.

1、把 GBK 编码字串转换成 UTF-8 编码字串 view plaincopy to clipboardprint?
header("content-Type: text/html; charset=Utf-8");  
echo mb_convert_encoding("你是我的好朋友", "UTF-8", "GBK");  
?>  


2、把 UTF-8 编码字串转换成 GB2312 编码字串 view plaincopy to clipboardprint?
// 注意将此文件存盘成   utf-8 编码格式文件再测试  
header("content-Type: text/html; charset=gb2312");  
echo mb_convert_encoding("你是我的好朋友", "gb312", "utf-8");  
?>   


信源:fleaphp.net
mb_convert_encoding 函数为php内部多字节字符串编码转换函数,可以在有需要的使用场合(如:解决在GB2312编码环境下使用Ajax产生的中文字乱码的问题)方便进行编码转换,以解决网页乱码的问题,使用非常方便,效率非常高,
几乎支持所有编码。PHP 4 >= 4.0.6、PHP 5 版本支持。

函数原型: 引用:
/**
* 多字节字符串编码转换函数
*
* @param string str 需要进行编码转换的字符串
* @param string to_encoding 指定转换为某种编码,如:gb2312、gbk、utf-8等
* @param mixed from_encoding 混合指定原来字串的编码,如:同时指定 JIS, eucjp-win, sjis-win 混合编码
* @return string
string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )使用举例:

1、把 GBK 编码字串转换成 UTF-8 编码字串 view plaincopy to clipboardprint?
header("content-Type: text/html; charset=Utf-8");  
echo mb_convert_encoding("你是我的好朋友", "UTF-8", "GBK");  
?>  


2、把 UTF-8 编码字串转换成 GB2312 编码字串 view plaincopy to clipboardprint?
// 注意将此文件存盘成   utf-8 编码格式文件再测试  
header("content-Type: text/html; charset=gb2312");  
echo mb_convert_encoding("你是我的好朋友", "gb312", "utf-8");  
?>   

// 注意将此文件存盘成   utf-8 编码格式文件再测试
3、对整个页面进行转换
该方法适用所有编码环境。这样把前128个字符以外(显示字符)的字符集都用   NCR(Numeric character reference,如“汉字”将转换成“汉字”这种形式)来表示,这样的编码在任意编码环境下页面都能正 常显示。

在php文件的头部加上下面三行代码: view plaincopy to clipboardprint?
mb_internal_encoding("gb2312");  // 这里的gb2312是你网站原来的编码  
mb_http_output("HTML-ENTITIES");  
ob_start('mb_output_handler');  

mb_internal_encoding("gb2312");   // 这里的gb2312是你网站原来的编码 mb_http_output("HTML-ENTITIES"); ob_start('mb_output_handler');
使用mb_convert_encoding 函数需启用PHP 的mbstring (multi-byte string)扩展。

查看php的信息页面,如果出现如下画面:
   2008-10-16_111050.png (137.62 KB)
2008-10-16 12:01

则说明已启用mbstring (multi-byte string)扩展支持。

如果没有出现上面的画面,则需要做如下设置,让php支持该扩展。

1、windows 服务器环境

编辑 php.ini 文件,将; extension=php_mbstring.dll 前面的 ; 去掉,重启网页服务器。

2、Linux服务器环境

在编译配置时加入 --enable-mbstring=cn 编译参数,再进行PHP的编译安装。

 

热门栏目