2009年7月29日星期三

比较全的PHP编码转换类(转)

转载:http://blog.163.com/wzd_0210/blog/static/24384962008215112636864/


因为对编码不熟悉,在处理起一些编码问题来,经常搞得抓耳挠腮的,最近在PHPChina中发现了一个高人写的类。可以完成一下转换

Charset::convert(string input,string incharset,string outcharset)

Charset::unescape(string escaped,string outcharset)

Charset::escape(string string,string incharset)

Charset::jsondecode(string encoded,string outcharset)

Charset::jsonencode(mix value,string incharset)

Charset::pinYin(string chinese,string incharset)

PHP代码


<?php   
/*  
 * 编码转换    
 * 说明:  
 * jsonencode 有参考Services_JSON 但有很大区别 此处可以将utf-8 gb2312 big5都可以jsonencode  
 * jsondecode 自己原创 该算法是模拟目录读取的方法   
 *   可以将json中中文unicode编码unescape为gbk big5 utf8   
 */  
define('TABLE_DIR','./table');   
define('USEEXISTS',FALSE);//是否使用系统存在的php内置编码转换函数   
//其实php内置编码转换函数转换的不够好   
class Charset{   
       
    private static $target_lang,$source_lang;   
    protected static $string = '';   
    protected static $table = NULL;  

PHP代码


/**  
 * 编码互换  
 *  
 * @param string $source  
 * @param string $source_lang  输入编码 'utf-8' or 'gb2312' or 'big5'  
 * @param string $target_lang  输出编码 'utf-8' or 'gb2312' or 'big5'  
 * @return string  
 */  
static public function convert($source,$source_lang,$target_lang='utf-8'){   
    if($source_lang != ''){   
        $source_lang = str_replace(   
            array('gbk','utf8','big-5'),   
            array('gb2312','utf-8','big5'),   
            strtolower($source_lang)   
        );   
    }   
    if($target_lang != ''){   
        $target_lang = str_replace(   
            array('gbk','utf8','big-5'),   
            array('gb2312','utf-8','big5'),   
            strtolower($target_lang)   
        );   
    }   
    if($source_lang == $target_lang||$source == ''){   
        return $source;   
    }   
    $index = $source_lang."_".$target_lang;   
    if(USEEXISTS&&!in_array($index,array('gb2312_big5','big5_gb2312'))){//繁简互换并不是交换字符集编码    
        if(function_exists('iconv')){   
            return iconv($source_lang,$target_lang,$source);   
        }   
        if(function_exists('mb_convert_encoding')){   
            return mb_convert_encoding($source,$target_lang,$source_lang);   
        }   
    }   
    $table = self::loadtable($index);   
    if(!$table){   
        return $source;   
    }   
    self::$string = $source;   
    self::$source_lang = $source_lang;   
    self::$target_lang = $target_lang;   
    if($source_lang=='gb2312'||$source_lang=='big5'){   
        if($target_lang=='utf-8'){   
            self::$table = $table;   
            return self::CHS2UTF8();   
        }   
        if($target_lang=='gb2312'){   
            self::$table = array_flip($table);   
        }else{   
            self::$table = $table;   
        }   
        return self::BIG2GB();   
    }elseif(self::$source_lang=='utf-8'){   
        self::$table = array_flip($table);   
        return self::UTF82CHS();   
    }   
    return NULL;   
}  

PHP代码


/**  
 * js 中的unescape功能  
 *   
 * @param string $str       源字符串  
 * @param string $charset   目标字符串编码 'utf-8' or 'gb2312' or 'big5'  
 * @return string  
 */  
static public function unescape($str,$charset='utf-8'){   
    $charset = strtolower($charset);   
    self::$target_lang = str_replace(   
        array('gbk','utf8','big-5'),   
        array('gb2312','utf-8','big5'),   
        $charset  
    );   
    if(self::$target_lang!='utf-8'&&   
        !(USEEXISTS&&(function_exists('mb_convert_encoding')||function_exists('iconv')))   
    ){   
        self::$table = array_flip(self::loadtable('unescapeto'.$charset));   
    }   
    return preg_replace_callback('/[\\\\|%]u(\w{4})/iU',array('Charset','descape'),$str);   
}  

PHP代码


/**  
 * js 中的escape功能  
 *   
 * @param string $str       源字符串  
 * @param string $charset   源字符串编码 'utf-8' or 'gb2312' or 'big5'  
 * @return string  
 */  
static public function escape($str,$charset='utf-8'){   
    $escaped = '';   
    $charset = strtolower($charset);   
    $charset = str_replace(   
        array('gbk','big-5','utf8'),   
        array('gb2312','big5','utf-8'),   
        $charset  
    );   
    $ulen = strlen($str);   
    if($charset!='utf-8'){   
        $table = self::loadtable($charset.'escape');   
        for($i=0;$i<$ulen;$i++){   
            $c = $str[$i];   
            if(ord($c)>0x80){   
                $bin = $c.$str[$i+1];   
                $i += 1;   
                $escaped .= sprintf('\u%04X',$table[hexdec(bin2hex($bin))]);   
                // bin2hex 返回的是string 必须再转化   
            }else{   
                $escaped .= $c;   
            }   
        }   
        return $escaped;   
    }else{   
        for($i=0;$i<$ulen;$i++){   
            $c = $str[$i];   
            $char = ord($c);   
            switch ($char>>4){   
                case 0: case 1: case 2: case 3: case 4: case 5: case 6: case 7:   
                    $escaped .= $c;   
                    break;   
                case 12: case 13:   
                    $char = ((($char&0x1F)<<6)|(ord($str[++$i])&0x3F));   
                    $escaped .= sprintf('\u%04X',$char);   
                    break;   
                case 14:   
                    $char = ((($char&0x0F)<<12)|((ord($str[++$i])&0x3F)<<6)|(ord($str[++$i])&0x3F));   
                    $escaped .= sprintf('\u%04X',$char);   
                    break;   
                default:$escaped .= $c;break;   
            }   
            /*$cb = decbin(ord($c));  
            if(strlen($cb)==8){  
                $csize = strpos(decbin(ord($cb)),"0");  
                for($j=0;$j < $csize;$j++){  
                    $i++;  
                    $c .= $str[$i];  
                }  
                $escaped .= sprintf('\u%04X',self::utf82u($c));  
            }else{  
                $escaped .= $c;  
            }*/  
        }   
        return $escaped;   
    }   
}  

PHP代码


/**  
 * json_decode  
 *   
 * @param string $encoded   源字符串  
 * @param string $charset   目标字符串编码 'utf-8' or 'gb2312' or 'big5'  
 * @return string/array/boolean/null  
 */    
static public function jsondecode($encoded,$charset='utf-8'){   
    $encoded = preg_replace('/([\t\b\f\n\r ])*/s','',$encoded);//eat whitespace   
    self::$target_lang = $charset;   
    $c = self::cursor($encoded);   
    switch($c){   
        case '{':return self::parseArray($encoded);   
        case '[':return self::parseArray($encoded,FALSE);   
        case '"':return self::string_find($encoded);   
        case 't':return TRUE;   
        case 'f':return FALSE;   
        case 'n':return NULL;   
        default:return self::num_read($c.$encoded);   
    }   
}  

PHP代码


/**  
 * json_encode  
 *   
 * @param mixvar $var       多类型变量  
 * @param string $charset   默认'utf-8'源变量中字符编码 'utf-8' or 'gb2312' or 'big5'  
 * @return string  
 */  
static public function jsonencode($var,$charset=NULL){   
    if(is_null($charset)){   
        $charset = self::$source_lang;   
    }else{   
        self::$source_lang = $charset;   
    }   
    if(!$charset){   
        $charset = 'utf-8';   
    }   
    switch (gettype($var)){   
        case 'boolean':   
            return $var ? 'true' : 'false';   
        case 'NULL':   
            return 'null';   
        case 'integer':   
            return (int) $var;   
        case 'double':   
        case 'float':   
            return (float) $var;   
        case 'string':   
            $var = strtr($var,array("\r" => '\\r',"\n" => '\\n',"\t" => '\\t',"\b"  => '\\b',   
                "\f" => '\\f','\\' => '\\\\','"' => '\"',"\x08" => '\b',"\x0c" => '\f')  
            );  
            $var = self::escape($var,$charset);  
            return '"'.$var.'"';  
        case 'array':  
            return self::encodearray($var);  
        case 'object':  
            $var = get_object_vars($var);  
            return self::encodearray($var);  
        default:return 'null';   
    }   
}  

PHP代码


    /**  
     * 汉字拼音  
     *  
     * @param string $str  
     * @param string $charset     输入编码 'utf-8' or 'gb2312' or 'big5'  
     * @return string  
     */  
    static public function PinYin($str,$charset='utf-8'){   
        if($charset!='gb2312'){   
            $str = self::convert($str,$charset,'gb2312');   
        }   
        self::$table = include(TABLE_DIR.'./pinyin.php');   
        $gblen = strlen($str);   
        $pin = '';   
        for($i=0;$i<$gblen;$i++){   
            $c = ord($str[$i]);   
            if($c > 0x00A0){   
                $index = 0x10000-($c*0x0100 + ord($str[++$i]));   
                $pin .= self::getPinYin($index);   
            }else{   
                $pin .= $str[$i];   
            }   
        }   
        return trim($pin);   
    }   
    static protected function getPinYin($index){   
        if($index==0x1534) return 'yan';   
        if($index>0x4F5F||$index<0x2807){   
            return '';   
        }   
        if(!self::$table){   
            return '';   
        }   
        while(true){   
            if(!isset(self::$table[$index])){   
                $index += 1;   
                if($index > 0x4F5F){   
                    return '';   
                }   
                continue;   
            }else{   
                return self::$table[$index];   
            }   
        }   
        return '';   
    }   
    static protected function loadtable($index){   
        static $table = array();   
        $tabIndex = '';   
        switch ($index) {   
            case 'gb2312_utf-8':   
            case 'utf-8_gb2312':   
            case 'gb2312escape':   
            case 'unescapetogb2312':   
                $tabIndex = 'gbkutf';   
                break;   
            case 'big5_utf-8':   
            case 'utf-8_big5':   
            case 'big5escape':   
            case 'unescapetobig5':   
                $tabIndex = 'big5utf';   
                break;   
            case 'gb2312_big5':   
            case 'big5_gb2312':   
                $tabIndex = 'gbkbig5';   
                break;   
            default:return NULL;   
        }   
        if(!isset($table[$tabIndex])){   
            $table[$tabIndex] = @include(TABLE_DIR."/".$tabIndex.".php");   
        }   
        return $table[$tabIndex];   
    }   
    static protected function descape($str){   
        $dec = hexdec($str[1]);   
        $str = self::u2utf8($dec);   
        if(self::$target_lang == 'utf-8'){   
            return $str;   
        }   
        if(USEEXISTS){   
            if(function_exists('iconv')){   
                return iconv('utf-8',self::$target_lang,$str);   
            }   
            if(function_exists('mb_convert_encoding')){   
                return mb_convert_encoding($str,self::$target_lang,'utf-8');   
            }   
        }   
        if(isset(self::$table[$dec])){   
            return self::hex2bin(dechex(self::$table[$dec]));   
        }else{   
            return "&#".$dec.";";   
        }   
    }   
    static protected function parseArray($str,$index=TRUE){   
        $result = array();   
        $fp = self::array_open($index,$str);//模拟打开目录   
        while($fp){   
            $type = '';   
            $key = '';   
            $value = self::array_read($fp,$type,$index,$key);//模拟读取目录   
            if($type=='{'){   
                if($index){   
                    $result[$key] = self::parseArray($fp);//递归   
                }else{   
                    $result[] = self::parseArray($fp);   
                }   
            }elseif($type=='['){   
                if($index){   
                    $result[$key] = self::parseArray($fp,FALSE);   
                }else{   
                    $result[] = self::parseArray($fp,FALSE);   
                }   
            }else{   
                if($index){   
                    $result[$key] = $value;   
                }else{   
                    $result[] = $value;   
                }   
            }   
        }   
        return $result;   
    }   
    static protected function array_open($index=TRUE,$string){   
        if($index){   
            $end = '}';   
            $new = '{';   
        }else{   
            $end = ']';   
            $new = '[';   
        }   
        $endpos = self::getpos($string,$end);   
        //用getpos获得$endpos 因为要判断{,},[,]是不是在字符串里面   
        $newpos = self::getpos($string,$new);   
        $fp = '';   
        if($endpos===FALSE){   
            return 'null';   
        }elseif($newpos===FALSE||$newpos>$endpos){   
            $fp = substr($string,0,$endpos);   
            $string = substr($string,$endpos+1);   
            return $fp;   
        }else{// 条件'if($newpos<$endpos)'可以不要了 找到与自己匹对结束符   
            $i = 1;   
            while($i){   
                $endpos = self::getpos($string,$end,$endpos+1);   
                $newpos = self::getpos($string,$new,$endpos+1);   
                if($endpos===FALSE){   
                    return 'null';   
                }elseif($newpos===FALSE){   
                    $i-=1;   
                    continue;   
                }elseif($newpos<$endpos){   
                    $i+=1;   
                    continue;   
                }else{   
                    continue;   
                }   
            }   
            $fp = substr($string,0,$endpos);   
            $string = substr($string,$endpos+1);   
            return $fp;   
        }   
    }   
    static protected function getpos($string,$sign,$offset=0){   
        /**  
         * 判断是否在字符串里面原理:  
         * 取得$offset到$pos($sign)位置之间字符串中'"'个数  
         * 如果为奇数说明在字符串里面 否则在字符串外面  
         */  
        $pos = strpos($string,$sign,$offset);   
        if($pos===FALSE){   
            return FALSE;   
        }   
        $str = substr($string,$offset,$pos-$offset);   
        $arr = array();   
        preg_match_all('/"/',str_replace('\"','',$str),$arr);   
        $in = count($arr[0])%2;   
        if(!$in){   
            return $pos;   
        }   
        do{   
            $next = strpos($string,$sign,$pos+1);   
            if($next===FALSE){   
                return FALSE;   
            }   
            $str = substr($string,$pos,$next-$pos);   
            $arr = array();   
            preg_match_all('/"/',str_replace('\"','',$str),$arr);   
            $in = !(count($arr[0])%2);   
            $pos = $next;   
        }while($in);   
        return $pos;   
    }   
    static protected function array_read($fp,$type,$index=TRUE,$key=null){   
        if($fp[0]==','){   
            self::cursor($fp);//跳过','   
        }   
        if($index){//有索引的数组    
            self::cursor($fp);//跳过 '"'合法   
            $key = self::string_find($fp);//读取索引值   
            self::cursor($fp);//跳过':'   
        }   
        $c = self::cursor($fp);   
        switch($c){   
            case '{':   
                $type='{';   
                return NULL;   
            case '[':   
                $type='[';   
                return NULL;   
            case '"':   
                $rs = self::string_find($fp);   
                $s = self::cursor($fp);//跳过','or '}' or ']' 要求合法   
                if(!($s==','||$s==null)){   
                    die('parse error1!');   
                }   
                return $rs;   
            case 't':   
                if(self::cursor($fp,3)=='rue'){//跳过'rue'   
                    $s = self::cursor($fp);//跳过','or '}' or ']' 要求合法   
                    if(!($s==','||$s==null)){   
                        die("parse error$s!");  
                    }  
                    return TRUE;  
                }else{  
                    die('parse error3!');  
                }  
            case 'f':  
                if(self::cursor($fp,4)=='alse'){  
                    $s = self::cursor($fp);//跳过','or '}' or ']' 要求合法  
                    if(!($s==','||$s==null)){  
                        die('parse error4!');  
                    }  
                    return FALSE;  
                }else{  
                    die('parse error5!');  
                }  
            case 'n':  
                if(self::cursor($fp,3)=='ull'){//跳过'ull'  
                    $s = self::cursor($fp);//跳过','or '}' or ']' 要求合法  
                    if(!($s==','||$s==null)){  
                        die('parse error6!');  
                    }  
                    return NULL;  
                }  
            default:  
                $pos = strpos($fp,',');  
                if($pos===FALSE){  
                    $num = substr($fp,0);  
                    $fp = '';  
                }else{  
                    $num = substr($fp,0,$pos);  
                    $fp = substr($fp,$pos+1);  
                }  
                return self::num_read($c.$num);  
        }  
    }  
    static protected function string_find(&$str){  
        $end = strpos($str,'"',0);   
        while($str[$end-1]=='\\'){  
            $end = strpos($str,'"',$end+1);  
            if($end===FALSE){  
                return 'null';  
            }  
        }  
        $escaped = strtr(  
            rtrim(self::cursor($str,$end+1),'"'),  
            array('\\"' => '"','\\\\'=> '\\','\\/'=> '/','\\b' => chr(8),  
                '\\f'=>chr(12),'\\n'=>chr(10),'\\r'=> chr(13),  
                '\\t'=>chr(9),'\\u'=>'%u'  
            )  
        );  
        return self::unescape($escaped,self::$target_lang);  
    }  
    static protected function num_read($str){  
        $matches = array();  
        if (preg_match('/-?([0-9])*(\.[0-9]*)?((e|E)((-|\+)?)[0-9]+)?/s',$str,$matches)){  
            $num = $matches[0];  
            $val   = intval($num);  
            $fval  = floatval($num);  
            $value = $val?$val:$fval;  
            return $value;  
        }else{  
            return NULL;  
        }  
    }  
    static protected function cursor(&$str,$shift=1){  
        $get = substr($str,0,$shift);  
        $str = substr($str,$shift);  
        return $get;  
    }  
    static protected function encodearray($array){  
        if(!$array){  
            return 'null';  
        }  
        if((array_keys($array)!==range(0,sizeof($array)- 1))){  
            $rs = '';  
            foreach($array as $key=>$value){  
                $rs .= ','.self::jsonencode(strval($key)).':';  
                if(is_array($value)){  
                    $rs .= self::encodearray($value);  
                }else{  
                    $rs .= self::jsonencode($value);  
                }  
            }  
            $rs = '{'.ltrim($rs,',').'}';  
            return $rs;  
        }else{  
            $rs = '';  
            foreach($array as $value){  
                if(is_array($value)){  
                    $rs .= ','.self::encodearray($value);  
                }else{  
                    $rs .= ','.self::jsonencode($value);  
                }  
            }  
            $rs = '['.ltrim($rs,',').']';  
            return $rs;  
        }  
    }  
    static protected function CHS2UTF8(){  
        $utf8 = "";  
        while(self::$string){  
            if (ord(self::$string[0]) > 0x80){  
                $bin = substr(self::$string,0,2);  
                $utf8 .= self::u2utf8(self::$table[hexdec(bin2hex($bin))]);  
                self::$string = substr(self::$string,2);  
            }else{  
                $utf8 .= self::$string[0];  
                self::$string = substr(self::$string,1);  
            }  
        }  
        return $utf8;  
    }  
    static protected function UTF82CHS(){  
        $chs  = "";  
        $ulen = strlen(self::$string);  
        for($i=0;$i<$ulen;$i++){  
            $c = self::$string[$i];  
            $char = ord($c);  
            switch ($char>>4){  
                case 0: case 1: case 2: case 3: case 4: case 5: case 6: case 7:  
                    $chs .= $c;  
                    break;  
                case 12: case 13:  
                    $char = self::$table[(($char&0x1F)<<6)|(ord(self::$string[++$i])&0x3F)];  
                    $chs .= self::hex2bin(dechex($char));  
                    break;  
                case 14:  
                    $char = self::$table[  
                        (($char&0x0F)<<12)  
                        |((ord(self::$string[++$i])&0x3F)<<6)  
                        |(ord(self::$string[++$i])& 0x3F)  
                    ];  
                    $chs .= self::hex2bin(dechex($char));  
                    break;  
                default:$chs .= $c;break;  
            }  
        }  
        /*for($i=0;$i<$ulen;$i++){  
            $c = self::$string[$i];  
            $cb = decbin(ord($c));  
            if(strlen($cb)==8){  
                $csize = strpos(decbin(ord($cb)),"0");  
                for($j=0;$j < $csize;$j++){  
                    $i++;  
                    $c .= self::$string[$i];  
                }  
                $c = self::utf82u($c);  
                if(isset(self::$table[$c])){  
                    $chs .= self::hex2bin(dechex(self::$table[$c]));  
                }else{   
                    $chs .= "&#".$c.";";  
                }  
            }else{  
                $chs .= $c;  
            }  
        }*/  
        return trim($chs);  
    }  
    static protected function BIG2GB(){  
        $ret = '';  
        while(self::$string){  
            if(ord(self::$string[0]) > 0x80){  
                $index = hexdec(bin2hex(self::$string[0].self::$string[1]));  
                $value = self::$table[$index];  
                $ret .= self::hex2bin(dechex($value));  
                self::$string = substr(self::$string,2);  
            }else{  
                $ret .= self::$string[0];  
                self::$string = substr(self::$string,1);  
            }  
        }  
        return $ret;  
    }  
    static protected function u2utf8($c){  
        $str = '';  
        if ($c < 0x80){  
            $str.= chr($c);  
        }elseif($c < 0x800){  
            $str.= chr(0xC0 | $c>>6);  
            $str.= chr(0x80 | $c & 0x3F);  
        }elseif($c < 0x10000){  
            $str.= chr(0xE0 | $c>>12);  
            $str.= chr(0x80 | $c>>6 & 0x3F);  
            $str.= chr(0x80 | $c & 0x3F);  
        }elseif($c < 0x200000){  
            $str.= chr(0xF0 | $c>>18);  
            $str.= chr(0x80 | $c>>12 & 0x3F);  
            $str.= chr(0x80 | $c>>6 & 0x3F);  
            $str.= chr(0x80 | $c & 0x3F);  
        }  
        return $str;  
    }  
    static protected function utf82u($c){  
        switch(strlen($c)) {  
            case 1:  
                return ord($c);  
                break;  
            case 2:  
                $n  = (ord($c[0]) & 0x3f) << 6;  
                $n += ord($c[1]) & 0x3f;  
                return $n;  
                break;  
            case 3:  
                $n  = (ord($c[0]) & 0x1f) << 12;  
                $n += (ord($c[1]) & 0x3f) << 6;  
                $n += ord($c[2]) & 0x3f;  
                return $n;  
                break;  
            case 4:  
                $n  = (ord($c[0]) & 0x0f) << 18;  
                $n += (ord($c[1]) & 0x3f) << 12;  
                $n += (ord($c[2]) & 0x3f) << 6;  
                $n += ord($c[3]) & 0x3f;  
                return $n;  
                break;  
            default:return '';break;  
        }  
    }  
    static protected function hex2bin($hexdata){  
        $bindata = '';   
        for ($i = 0, $count = strlen($hexdata); $i < $count; $i += 2){   
            $bindata .= chr(hexdec($hexdata[$i].$hexdata[$i + 1]));   
        }   
        return $bindata;   
    }   
}  

PHP 开发中的中文编码问题(转)

转载:http://www.phpchina.com/bbs/thread-68629-1-1.html

  PHP程序设计中中文编码问题曾经困扰很多人,导致这个问题的原因其实很简单,每个国家(或区域)都规定了计算机信息交换用的字符编码集,如美国的扩 展 ASCII 码, 中国的 GB2312-80,日本的 JIS 等。作为该国家/区域内信息处理的基础,字符编码集起着统一编码的重要作用。字符编码集按长度分为 SBCS(单字节字符集),DBCS(双字节字符集)两大类。早期的软件(尤其是操作系统),为了解决本地字符信息的计算机处理,出现了各种本地化版本 (L10N),为了区分,引进了 LANG, Codepage 等概念。但是由于各个本地字符集代码范围重叠,相互间信息交换困难;软件各个本地化版本独立维护成本较高。因此有必要将本地化工作中的共性抽取出来,作一 致处理,将特别的本地化处理内容降低到最少。这也就是所谓的国际化(118N)。各种语言信息被进一步规范为 Locale 信息。处理的底层字符集变成了几乎包含了所有字形的 Unicode。

  现在大部分具有国际化特征的软件核心字符处理都是以 Unicode 为基础的,在软件运行时根据当时的ocale/Lang/Codepage 设置确定相应的本地字符编码设置,并依此处理本地字符。在处理过程中需要实现 Unicode 和本地字符集的相互转换,甚或以 Unicode 为中间的两个不同本地字符集的相互转换。这种方式在网络环境下被进一步延伸,任何网络两端的字符信息也需要根据字符集的设置转换成可接受的内容。

  数据库中的字符集编码问题

  流行的关系数据库系统都支持数据库字符集编码,也就是说在创建数据库时可以指定它自己的字符集设置,数据库的数据以指定的编码形式存储。当应用程序访 问数据时,在入口和出口处都会有字符集编码的转换。对于中文数据,数据库字符编码的设置应当保证数据的完整性。GB2312、GBK、UTF-8 等都是可选的数据库字符集编码;当然我们也可以选择 ISO8859-1 (8-bit),只是我们得在应

  用程序写数据之前先将 16Bit 的一个汉字或 Unicode 拆分成两个 8-bit 的字符,读数据之后也需要将两个字节合并起来,同时还要判别其中的 SBCS 字符,因此我们并不推荐采用 ISO8859-1 作为数据库字符集编码。这样不但没有充分利用数据库自身的字符集编码支持,而且同时也增加了编程的复杂度。编程时,可以先用数据库管理系统提供的管理功能 检查其中的中文数据是否正确。

  PHP 程序在查询数据库之前,首先执行 mysql_query("SET NAMES xxxx"); 其中 xxxx 是你网页的编码(charset=xxxx),如果网页中 charset=utf8,则 xxxx=utf8,如果网页中 charset=gb2312,则xxxx=gb2312,几乎所有 WEB 程序,都有一段连接数据库的公共代码,放在一个文件里,在这文件里,加入 mysql_query("SET NAMES xxxx") 就可以了。

  SET NAMES 显示客户端发送的 SQL 语句中使用什么字符集。因此,SET NAMES 'utf-8' 语句告诉服务器"将来从这个客户端传来的信息采用字符集 utf-8"。它还为服务器发送回客户端的结果指定了字符集(例如,如果你使用一个 SELECT 语句,它表示列值使用了什么字符集)。

  定位问题时常用的技巧

  定位中文编码问题通常采用最笨的也是最有效的办法�在你认为有嫌疑的程序处理后打印字符串的内码。通过打印字符串的内码,你可以发现什么时候中文字符 被转换成 Unicode,什么时候Unicode 被转回中文内码,什么时候一个中文字成了两个 Unicode 字符,什么时候中文字符串被转成了一串问号,什么时候中文字符串的高位被截掉了……

  取用合适的样本字符串也有助于区分问题的类型。如:"aa啊 aa?@aa" 等中英相间,GB、GBK特征字符均有的字符串。一般来说,英文字符无论怎么转换或处理,都不会失真(如果遇到了,可以尝试着增加连续的英文字母长度)。

  解决各种应用的乱码问题

  1) 使用 标签设置页面编码

  这个标签的作用是声明客户端的浏览器用什么字符集编码显示该页面,xxx 可以为 GB2312、GBK、UTF-8(和 MySQL 不同,MySQL 是 UTF8)等等。因此,大部分页面可以采用这种方式来告诉浏览器显示这个页面的时候采用什么编码,这样才不会造成编码错误而产生乱码。但是有的时候我们会 发现有了这句还是不行,不管 xxx 是哪一种,浏览器采用的始终都是一种编码,这个情况我后面会谈到。

  请注意, 是属于 HTML 信息的,仅仅是一个声明,仅表明服务器已经把 HTML 信息传到了浏览器。

  2) header("content-type:text/html; charset=xxx");

  这个函数 header() 的作用是把括号里面的信息发到 http 标头。如果括号里面的内容为文中所说那样,那作用和 标签基本相同,大家对照第一个看发现字符都差不多的。但是不同的是如果有这段函数,浏览器就会永远采用你所要求的 xxx 编码,绝对不会不听话,因此这个函数是很有用的。为什么会这样呢?那就得说说 http 标头和 HTML信息的差别了:

  http 标头是服务器以 http 协议传送 HTML 信息到浏览器前所送出的字串。而 标签是属于 HTML 信息的,所以 header() 发送的内容先到达浏览器,通俗点就是 header() 的优先级高于 (不知道可不可以这样讲)。假如一个 php 页面既有header("content-type:text/html;charset=xxx"),又有,浏览器就只认前者 http 标头而不认 meta 了。当然这个函数只能在 php 页面内使用。

  同样也留有一个问题,为什么前者就绝对起作用,而后者有时候就不行呢?这就是接下来要谈的Apache 的原因了。

  3) AddDefaultCharset

  Apache 根目录的 conf 文件夹里,有整个 Apache 的配置文档 httpd.conf。

  用文本编辑器打开 httpd.conf,第 708 行(不同版本可能不同)有 AddDefaultCharset xxx,xxx为编码名称。这行代码的意思:设置整个服务器内的网页文件 http 标头里的字符集为你默认的 xxx字符集。有这行,就相当于给每个文件都加了一行 header("content-type:text/html; charset=xxx")。这下就明白为什么明明 设置了是 utf-8,可浏览器始终采用 gb2312 的原因。

  如果网页里有 header("content-type:text/html; charset=xxx"),就把默认的字符集改为你设置的字符集,所以这个函数永远有用。如果把 AddDefaultCharset xxx 前面加个"#",注释掉这句,而且页面里不含 header("content-type…"),那这个时候就轮到 meta 标签起作用了。

  下面列出以上的优先顺序:

  .. header("content-type:text/html; charset=xxx")

  .. AddDefaultCharset xxx

  ..

  如果你是 web 程序员,建议给你的每个页面都加个header("content-type:text/html;charset=xxx"),这样就可以保证它在任何服务器都能正确显示,可移植性也比较强。

  4) php.ini 中的 default_charset 配置:

  php.ini 中的 default_charset = "gb2312" 定义了 php 的默认语言字符集。一般推荐注释掉此行,让浏览器根据网页头中的 charset 来自动选择语言而非做一个强制性的规定,这样就可以在同台服务器上提供多种语言的网页服务。

php编码转换方案集锦(转)


转载:http://www.lupaworld.com/bbs/thread-20172-1-1.html

  1)如果从数据库读取,可以读取mysql前设置编码,代码如下:
mysql_query("SET NAMES &#39;utf-8&#39;",$database-&gt;_resource);
mysql_query("SET CHARACTER SET utf-8",$database-&gt;_resource);
但不是总有效,设置gb2312就不行;

2)使用iconv函数转换编码,但是Php默认不支持。代码如下:
&lt;?php
function gb2utf($string) {
  $out = iconv( "gb2312", "UTF-8" , $string);
  return $out;
}

//example:
$oldword = "中国人abc123";
$newwords = gb2utf($oldword);
echo $newwords;
?&gt;  

3)使用mb_convert_encoding函数转换编码,有些虚拟主机不支持;

4)下载encode_convert.rar压缩包使用。
http://ment.cn/encode_convert.rar[/quote]

5)
这个也要服务器的支持..
function toutf8($str)
{
             $str = mb_convert_encoding($str,"utf-8","gbk");
             $convmap = array(0x0080, 0xffff, 0x0000, 0xffff);
             //0x0026, 0x0026, 0x0000, 0xffff);  &lt;-这个是转&号为&
             $str = mb_encode_numericentity($str, $convmap, "utf-8");
             return $str;
}


介绍和使用:
使用方法:
将压缩包解压到你需要转换的文件夹下面,转化之前最好先备份。
然后运行encode.php设置好参数 就可以开始转化了
可以转化这个文件夹以及他下面所有子文件夹的文件
可以设置您不需要转化的文件夹和文件,和需要转化的文件类型
我想这么多 应该够用了
支持gb2312,utf8,big5互转!

2009年7月28日星期二

php中类似asp的left和right功能(转)

转载:http://bbs.admin5.com/thread-1093424-1-1.html

经常看到有新手问php有没有类似asp的left函数或right函数,实现截取某字符串左边或右边开始N个字符的函数
答案当然是有的。php中的substr函数就可以做的到,只不过php把二个函数合二为一了。 php程序员站
小弟不才整理了一下substr函数的用法,做了几个例子以解新人之惑,高手请飘过
php程序员站

我们先来看一下substr 的语法
string substr(string string, int start, int [length]) php程序员站
参数string为要操作的字符串
参数start为你要截取的字符串的开始位置,若start为负数时,则表示从倒数第start开始截取length 个字符.
可选参数 length为你要截取的字符串长度,若在使用时不指定则默认取到字符串结尾。若length为负数时,则表示从start开始向右截取到末尾倒数第length个字符的位置

起初用这个函数时可能感觉到别扭,不过你要是把他的语法搞懂了,那他的功能比 asp中的left和right,有过之无不及。非常好用。
下面我们举例来看他的用法:
1,从第4个字符开始截取到字符串末尾,类似asp中的left   

以下为引用的内容:
<?php
$str = "www.117y.com";
echo substr($str,4);
?>
  输出: 117y.com



2,从右边截取3个字符,类似asp中的right

以下为引用的内容:
<?php
$str = "www.7ysms.com";
echo substr($str,-3);
?>
输出:com



3,从第4个字符开始截取6个字符 php程序员站

以下为引用的内容:
<?php
$str = "www.xhsms.cn";
echo substr($str,4,5);
?>  
输出:xhsms  



4,有时我们知道一个字符串的开始和结尾,中间是不定长的字符,这时除了用正则外我们还可以用substr实现(当然要得到中间的字符方法有N种,在此只是举例substr的应用)


以下为引用的内容:
<?php
$str = "<|>www.71sms.net<|>";
echo substr($str,3,-3);
?>

php调用sqlite


2007-07-10 13:30:03 建议使用php5.0.0以上版本

1.建立测试php文件sqlitetest.php,代码如下:
<?php

//建立数据库连接
$db = @sqlite_open("C:\\wamp\\sqlitemanager\\dbtest.db");

//异常处理
if(!$db) die("Connection Sqlite failed.\n");

//add a table
@sqlite_query($db, "CREATE TABLE table1(id int(4),name varchar(20))");

//add  records
@sqlite_query($db, "INSERT INTO table1 VALUES(1,'zhang')");
//query records
$result = @sqlite_query($db, "SELECT * from table1");

//打印结果
print_r(sqlite_fetch_array($result));

?>

我们看到的输出结果是:

Array ( [0] => 1 [id] => 1 [1] => zhang [name] => zhang )


<?php
/**
 * 文件:sqlite.php
 * 功能:对sqlite数据库的处理
 * 作者:bjllm
 * 时间:2007-7-10
 */

define("LN", _LINE_); //行号
define("FL", _FILE_); //当前文件
define("DEBUG", 0);   //调试开关

$db_name = "C:\\wamp\\sqlitemanager\\dbtest.db";

//创建数据库文件
if(!file_exists($db_name))
{
  if(!($fp = fopen($db_name, "w+")))
  {
    exit(error_code(-1, LN));
  }
  fclose($fp);
}

//打开数据库文件
if(!($db = sqlite_open($db_name)))
{
  exit(error_code(-2, LN));
}

//产生数据表结构
if (!sqlite_query($db, "DROP TABLE test")) {        //有test表,不一定要创建结构
 exit(error_code(-3, LN));
}


if (!sqlite_query($db, "CREATE TABLE test (id integer primary key,name varchar(10) UNIQUE)")) {
 exit(error_code(-3, LN));
}

//插入两条数据
if(!sqlite_query($db, "INSERT INTO test(name) VALUES('holly')"))
{
  exit(error_code(-4, LN));
}
if(!sqlite_query($db, "INSERT INTO test(name) VALUES('orang')"))
{
  exit(error_code(-4, LN));
}

//删除数据
if(!sqlite_query($db, "DELETE FROM test WHERE name = 'holly' "))
{
  exit(error_code(-4, LN));
}

//修改数据
if(!sqlite_query($db, "UPDATE test SET NAME = 'tom' WHERE name = 'orang' "))
{
  exit(error_code(-4, LN));
}

//检索数据
if(!($result = sqlite_query($db, "SELECT * FROM test")))
{
  exit(error_code(-5, LN));
}

//获取检索数据并显示
while($array = sqlite_fetch_array($result))
{
  echo "ID: ". $array[id]."&nbsp;&nbsp;Name: ". $array[name]."<br>";
}

/*错误信息代码函数*/
function error_code($code, $line_num, $debug = DEBUG)
{
  if($code < -6 || $code > -1)
  {
    return false;
  }
  switch($code)
  {
    case -1: $errmsg = "Create database file error.";
      break;
    case -2: $errmsg = "Open sqlite database file failed.";
      break;
    case -3: $errmsg = "Create table failed, table already exist.";
      break;
    case -4: $errmsg = "Insert data failed.";
      break;
    case -5: $errmsg = "Query database data failed.";
      break;
    case -6: $errmsg = "Fetch data failed.";
      break;
    case -7: $errmsg = "";
      break;
    default: $errmsg = "Unknown error.";
  }

  $m = "<b>[ Error ]</b><br>File: ". basename(FL) ." <br>Line: ". LN ."<br>Mesg: ".$errmsg ."";
 if (!$debug)
 {
  ($m = $errmsg);
 }
 return $m;
}
?>

[PHP] ADODB入门

[PHP] ADODB入门

本文链接:
http://www.openphp.cn/index.php/article/3/154/index.html

1. 前言

ADODB 是 Active Data Objects Data Base 的简称,它是一种 PHP 存取数据库的函式组件。现在 SFS3 系统 (校园自由软件交流网学务系统) 计划的主持人陈莹光老师,决定采用此一组件,为了让更多有心参与该项目的伙伴们能够顺利加入发展的行列,小弟认为有必要把 ADODB 的中文入门介绍写出来,以方便伙伴们参考备查。

虽然 PHP 是建构 Web 系统强有力的工具,但是 PHP 存取数据库的功能,一直未能标准化,每一种数据库,都使用另一种不同且不兼容的应用程序接口(API)。为了填补这个缺憾,因此才有 ADODB 的出现。一旦存取数据库的接口予以标准化,就能隐藏各种数据库的差异,若欲转换至其它不同的数据库,将变得十分容易。

目前 ADODB 支持的数据库种类非常地多,例如:MySQL, PostgreSQL, Interbase, Informix, Oracle, MS SQL 7, Foxpro, Access, ADO, Sybase, DB2 以及一般的 ODBC (其中 PostgreSQL、Informix、Sybase 的driver 是由自由软件社群发展之后贡献出来的)。

使用 ADODB 最大的优点之一是:不管后端数据库如何,存取数据库的方式都是一致的,开发设计人员不必为了某一套数据库,而必须再学习另一套不同的存取方法,这大大减轻开发人员的知识负担,过去的知识往后仍可继续使用,转移数据库平台时,程序代码也不必做太大的更动。

其实 ADODB 这样的发展理念,并不是首创的,DBI 比 ADODB 出现得更早,它提供 Perl 存取数据库时,使用一致的 API 呼叫接口。相信用过 Perl + DBI 的朋友,再来用 ADODB 时,会有一种似曾相识的感觉。

另外,ADODB 对用过 ASP 的人而言,应该不陌生,这类朋友对 ADODB 应该很容易接受。

我们来看一下,ADODB 的简单用法:

<?php
    // 引入 adodb 的 inc 档,才能呼叫 adodb 提供的函式
    include('adodb/adodb.inc.php');

    // 选择连接的数据库种类,以建立联机对象,
    // 一旦对象建立,即可使用其成员函式来处理数据库。
    // 以下 $conn 即此一物件(object)
    $conn = &ADONewConnection('mysql');

    // 要不要显示侦错讯息,false 不要,true 要。
    // $conn->debug = false;
   
    $conn->debug = true;

    // 连接数据库
    // 用法:$conn->Connect('主机', '使用者', '密码', '数据库');
    // 用例:
    $conn->Connect('localhost', 'piza', 'ooo123', 'test');

    // 若欲采用持续性连接,上式可换用 PConnect:
    // $conn->PConnect('localhost', 'piza', 'ooo123', 'test');

    // 设定 sql 命令
    $sql = "insert into t values ('abcde', 18)";

    // 执行 sql 命令
    $rs = $conn->Execute($sql);

    // 检查执行结果,若 $rs == false,则呼叫 $conn 对象的成员函式 ErrorMsg()
    if (!$rs) print $conn->ErrorMsg(); else print "OK!";

?>


结果如下:

---------------------------------------------
(mysql): insert into t values ("abcde",18)
---------------------------------------------
OK!


若把侦错关掉,即 $conn->debug=false,则结果如下:

OK!


以下,逐步为各位介绍:使用 ADODB 的重点方法。

2. 安装

ADODB 的首页在:http://php.weblogs.com/ADOdb,目前(2002/10/24)最新版是:2.42 版,可至 ADODB 下载或至台南县教网中心 FTP 下载。

安装 ADODB 的方法超极简单,只要下载、解压、放入适当位置,即可完成 ! 如下所示:

1. 下载:

$ ncftp ftp.tnc.edu.tw

  cd sysop/ADODB

  get adodb242.tgz

2. 解压:

假设我把 adodb242.tgz 放入 /var/www/html 中

$ cp adodb242.tgz /var/www/html

$ tar xvzf adodb242.tgz

如下所示:

adodb/adodb-cryptsession.php
adodb/adodb-csvlib.inc.php
adodb/adodb-errorhandler.inc.php
adodb/adodb-errorpear.inc.php
adodb/adodb-lib.inc.php
adodb/adodb-pager.inc.php
....以下省略....


现在,您在 /var/www/html/adodb 已安装好 ADODB 了。

3. 引入 ADODB

一旦安装好 ADODB,使用前,应把 ADODB 相关的含入文件引入您的程序中。adodb 目录放在任何位置无所谓,只要能指向正确路径文件名即可。一般而言,您的程序代码只须引入 adodb.inc.php。

作法如下:

在您的 PHP 程序中:

include('路径/adodb/adodb.inc.php');

include_once('路径/adodb/adodb.inc.php');


例:

若您的程序和 adodb 在同一目录下:

.
..
adodb/
something.php*


则:

include('adodb/adodb.inc.php');

即可。

若位置是在某一个目录 somedir 中:

.
..
adodb
somedir/something.php


则必须使用:

include('../adodb/adodb.inc.php');


除了 adodb.inc.php 这个含入档,ADODB 还提供许多 adodb-*.inc.php 的含入档,这些多半是为驱动某些数据库的特殊用法而设的。

若是引入 adodb-session.php 则可让您将 session 存入数据库中来维护运用。

若是引入 adodb-pager.inc.php,可方便您做分页显示。

若是引入 adodb-errorhandler.inc.php,可让您自订错误处理讯息。

若是含入 adodb-pear.inc.php,可让您使用 PHP4 的 PEAR DB 语法来使用 ADODB。此时,尚可使用 DSN 连接数据库的字符串设定。如 $dsn="mysql://piza:ooo123@localhost/test";

若是引入 tohtml.inc.php,可帮您在程序代码中,方便将取出的记录,转成 HTML 的表格(table)来显示。

若是引入 toexport.inc.php,可让您方便地输出 CSV 档或以 tab 分隔字段的数据文件。

若是引入 rsfilter.inc.php,可让您在使用记录之前,预做过滤处理。

若是引入 pivottable.inc.php,可让您使用 pivot table 功能(俗称 cross-tabulations)。

注意 ! adodb.inc.php 是一定要引入的,其它,则视您要使用那一个功能,再引入该含入档即可。

4. 选用数据库种类,建立联机对象

由于 ADODB 使用对象导向的作法,因此您在引入档之后,接着请视您后端数据库的种类,建立一个联机对象。作法如下:

以 MySQL 数据库为例:

    $conn = &ADONewConnection('mysql');

注:NewADOConnection 和 ADONewConnection 是一样的,二者皆可使用。


上例中的 'mysql' 是指数据库的 drvier 的种类,ADODB 会据此呼叫对应的数据库 driver。

其它常用的 driver 有:access、ado、ado_access、ado_mssql、db2、vfp、ibase、borland_ibase、informix、 imformix72、mssql、oci8、odbc、postgres、postgres64、postgres7、sqlanywhere、 sybase....等等。

我们称建立的对象 $conn 为一 ADOConnection 对象,它代表与数据库的连接事务,皆透过这个对象来处理。ADOConnection 对象会提供许多处理的方法,以对象导向的说法,这些方法称为成员函式,这是外界存取此一对象的接口。

一旦联机对象建立之后,就有许多对象函式可供您使唤啦 ! 请看下一节的介绍。

5. 侦错模式

程序开发的过程,为了方便查出出现问题可能的地方,通常我们会打开侦错模式,俟程序功能确实稳定之后,再将它关闭。ADODB 提供侦错模式,存取数据库时,能显示其运作方式。

打开侦错模式,使用法:

$conn->debug=true


关闭侦错模式,使用法:

$conn->debug=false

6. 连接数据库

接着,使用 $conn 联机对象的 Connect 或 PConnect 函式来连接特定的数据库,此时必须提供 DSN (Data Source Names)相关数据,DSN 可能包括:主机名称、数据库使用者、数据库密码、数据库名称。不同的数据库种类,DSN 可能可以省略其中若干项。以 MySQL 而言,则上述四者都要提供。

该函式会传回 true 或 false,用以表示是否连接成功。

用例:

// 格式:$conn->Connect('主机', '使用者', '密码', '数据库');

    $conn->Connect('localhost', 'piza', 'ooo123', 'test');

或者,采持续性连接:

// 格式:$conn->PConnect('主机', '使用者', '密码', '数据库');

    $conn->PConnect('localhost', 'piza', 'ooo123', 'test');
 

若欲探查是否有联机成功,可用一个变量来接取传回值:

$mch="localhost";
$user="piza";
$pwd="ooo123";
$database="test";

$cok = $conn->Connect($mch, $user, $pwd, $database);

或者,采持续性连接:

$cok = $conn->PConnect($mch, $user, $pwd, $database);

if (!$cok) { echo "无法连接数据库 $database"; exit; }

7. 设定 sql 命令语法、执行 sql 命令

接下来,您就可以设计您要执行的 sql 命令语法,然后付诸执行。

$sql = "这里放 SQL 的命令语法";

$rs = $conn->Execute($sql);


其中,$rs 为回传的结果,若 $rs == false,则表示执行失败,您必须仔细检查一下。

您不一定要把命令语法放在 $sql 变量中,也可以直接放入 Execute( ) 括号中。若命令较短无妨,若命令较长,我建议您还是用一个变量 $sql 来设定命令字符串吧 !

下一节开始,为各位介绍 SQL 的基本命令,如:Insert、Select、Update、Delete 等等的用法。

8. 插入记录(Insert)

Insert 的用法如下:

// $name 为字符串,$year 为数字
$name='abcde';
$year=18;

// 插入一笔记录,命令的大小写无妨,但数据表 t 及变量则大小写有分别 !
$sql = "INSERT INTO t VALUES ('$name', $year)";

// $sql = "insert into t values ('$name', $year)"; 亦可。

// 执行
$rs = $conn->Execute($sql);

// 检查执行结果,进行错误处理;若正常,则继续其它动作....
if (!$rs) print $conn->ErrorMsg();

....以下省略....


ErrorMsg() 是错误显示的函式,它会取出错误讯息,并显示出来。

另外,ADODB 提供一种 记录集(RecordSet) 函式 GetInsertSQL(),可帮您产生 Insert 的语法。

例子如下:

<?php

// 引入 ADODB
include('adodb/adodb.inc.php');

// 建立联机对象
$conn = &ADONewConnection('mysql');

// 侦错
$conn->debug=true;

// DSN 四项基本数据设定
$mch="localhost";
$user="root";
$pwd="jack168";
$database="test";

// 连接至数据库 test
$conn->PConnect($mch, $user, $pwd, $database);

// 产生一笔空记录
$sql = "select * from t where year=-1";

$rs = $conn->Execute($sql);


// 用一个空数组来装要更新的数据
$r = array();

$r['name']='john';
$r['year']=28;

// 用 GetInsertSQL 函式来制作一个完整的 sql 命令,此 sql 命令放在 $insertSQL 中
$insertSQL = $conn->GetInsertSQL($rs, $r);

// 执行插入
$conn->Execute($insertSQL);

$conn->Close();
?>


侦错讯息如下:

-----------------------------------------------------------
(mysql): select * from t where year=-1
-----------------------------------------------------------
(mysql): INSERT INTO t ( name, year ) VALUES ( 'john', 28 )
-----------------------------------------------------------
   

9. 取出记录(Select)

Select 的用法如下:

<?php

// 引入 ADODB
include('adodb/adodb.inc.php');

// 建立联机对象
$conn = &ADONewConnection('mysql');

// 不侦错
$conn->debug=false;

// DSN 四项基本数据设定
$mch="localhost";
$user="piza";
$pwd="ooo123";
$database="test";

// 连接至数据库 test
$conn->PConnect($mch, $user, $pwd, $database);

// 执行 Select 由表格 t 取出数据,
// 它会传回一个 ADORecordSet 记录集对象 $rs (RecordSet)
// 实际上 $rs 是一个 cursor 指标,它拥有目前的记录(row 或称 record),
// 该记录的所有字段数据的内容,存放在 fields 这个数组之中
// ,以数字为索引,第一个由 0 开始
$rs = &$conn->Execute('select * from t');

// 若 $rs 为 false,则秀出错误讯息
if (!$rs) {
    print $conn->ErrorMsg();
} else {

// 当尚未到达 记录集 $rs 的结束位置(EOF:End Of File)时,(即:还有记录尚未取出时)
    while (!$rs->EOF) {
        // 秀出所有字段,$FieldCount() 会传回字段总数
    for ($i=0, $max=$rs->FieldCount(); $i < $max; $i++) {
        print $rs->fields[$i] . " ";
    }

        // 移至下一笔记录
    $rs->MoveNext();
   
    // 换列
    echo "<br>\n";
    }
}

$rs->Close(); // 可不用
$conn->Close(); // 可不用
?>


$rs->fields[] 数组是由 PHP 的数据库扩展功能产生的,某些扩展功能并不支持使用字段名称当作索引。

若欲使用名称当作索引,也就是俗称的 hash 或 associative arrays,则需使用全域变量 $ADODB_FETCH_MODE 加以指定。

以下设定:使用数字索引 $ADODB_FETCH_MODE= ADODB_FETCH_NUM;


以下设定:使用名称索引 $ADODB_FETCH_MODE= ADODB_FETCH_ASSOC;


下面是使用名称索引的例子:

<?php

// 引入 ADODB
include('adodb/adodb.inc.php');

// 建立联机对象
$conn = &ADONewConnection('mysql');

// 不侦错
$conn->debug=false;

// DSN 四项基本数据设定
$mch="localhost";
$user="root";
$pwd="jack168";
$database="test";

// 连接至数据库 test
$conn->PConnect($mch, $user, $pwd, $database);

// 执行 sql 之前,指定使用名称索引
$ADODB_FETCH_MODE = ADODB_FETCH_ASSOC;

// 执行 Select,它会传回一个 ADORecordSet 记录集对象 $rs
// 实际上 $rs 是一个 cursor 指标,它拥有目前的记录内容,
// 该记录存放在 fields 这个数组之中
$rs = &$conn->Execute('select * from t');

// 若 $rs 为 false,则秀出错误讯息
if (!$rs) {
    print $conn->ErrorMsg();
} else {

// 当尚未到达记录集结束位置(EOF)时,
    while (!$rs->EOF) {
        // 秀出所有字段

    print $rs->fields['name'] . " " . $rs->fields['year'];

        // 移至下一笔记录
    $rs->MoveNext();
   
    // 换列
    echo "<br>\n";
    }
}

$rs->Close();  // 可不用
$conn->Close(); // 可不用
?>

10. 取出记录(使用 FetchRow)

这里示范 FetchRow 的用法:

$sql = "select * from t";

$rs = $conn->Execute($sql);

if ($rs) {
    while( $ar = $rs->FetchRow() ) {
        print $ar['name'] ." " . $ar['year'];
        print "<br>\n";
    }

}


FetchRow() 会将取出的记录传回,您可用一个 array 来接取。

注意 ! 使用 FetchRow() 就不必再用 MoveNext(),FetchRow 内部会自动完成移至下一笔记录的动作。

11. 更新记录(Update)

您可以用传统的方式:

$sql ="UPDATE t SET name='john', year=28 WHERE year=18";
$conn->Execute($sql);


也可以用以下这种方式:

<?php

// 引入 ADODB
include('adodb/adodb.inc.php');

// 建立联机对象
$conn = &ADONewConnection('mysql');

// 侦错
$conn->debug=true;

// DSN 四项基本数据设定
$mch="localhost";
$user="piza";
$pwd="ooo123";
$database="test";

// 连接至数据库 test
$conn->PConnect($mch, $user, $pwd, $database);

// 选择要更新的那一笔记录
$sql = "select * from t where year=18";

$rs = $conn->Execute($sql);


// 用一个空数组来装要更新的数据
$r = array();

$r['name']='john';
$r['year']=28;

// 用 GetUpdateSQL 函式来制作一个完整的 sql 命令,此 sql 命令放在 $updateSQL 中
$updateSQL = $conn->GetUpdateSQL($rs, $r);

// 执行更新
$conn->Execute($updateSQL);

$conn->Close();
?>


侦错讯息如下:

-------------------------------------------------------------
(mysql): select * from t where year=18
-------------------------------------------------------------
(mysql): UPDATE t SET name = 'john', year = 28 WHERE year=18
-------------------------------------------------------------

12. 删除记录(Delete)

删除记录很简单,采传统方式即可: $sql = "DELETE FROM t WHERE year=18";

$rs = $conn->Execute($sql);

13. 使用字段对象(Field Objects)

这里示范字段对象 FetchField 的用法,用以取得字段名称及字段型态:

$sql = "select * from t";

$rs = &$conn->Execute($sql);

if ($rs) {
   while (!$rs->EOF) {
    // 取出第二个字段
    $f = $rs->FetchField(1);

    // 印出字段名称 及 字段型态
    print $f->name . ":" . $f->type;

    $rs->MoveNext();

    print "<br>\n";
   }
}
 

另外,ADODB 提供一个 RecordSet 函式 MetaType(),可将原始的字段型态转成一般型态代码:

C : 字符
X : text
B : blob
D : 日期
T : timestamp
L : 布尔值或位
I : 整数
N : 数字型态,包括:自动增加、数值、浮点数、实数及整数
R : serial、自动增加


用例: 

    $f = $rs->FetchField(1);

    // 印出字段名称 及 字段型态的代码
    print $f->name . ":" . $rs->MetaType($f->type);

14. 简单分页(Pager)

ADODB 提供一种简单分页显示记录的方法,使用前,要将 adodb-pager.inc.php 引入。

<?php

include('adodb/adodb.inc.php');

// 引入分页功能
include('adodb/adodb-pager.inc.php');

// 启动 session
session_start();

$db = ADONewConnection('mysql');

$mch="localhost";
$user="piza";
$pwd="ooo123";
$database="test";

$db->Connect($mch, $user, $pwd, $database);

$sql = "select * from t";

// 产生 pager 对象
$pager = new ADODB_Pager($db, $sql);

// 每一页秀 5 笔记录
$pager->Render($rows_per_page=5);

?>


结果如下:

Figure 1. 简单分页功能


每页显示记录的数目是由 Render() 来控制的,若没有传入指定的 row 数给 Render(),默认值每页秀 10 笔。

另外,字段名称也可以改变,如下示范:

<?php

include('adodb/adodb.inc.php');

// 引入分页功能
include('adodb/adodb-pager.inc.php');

// 启动 session
session_start();

$db = ADONewConnection('mysql');

$mch="localhost";
$user="piza";
$pwd="ooo123";
$database="test";

$db->Connect($mch, $user, $pwd, $database);

$sql = "select name as '姓名', year as '年纪' from t";

// 产生 pager 对象
$pager = new ADODB_Pager($db, $sql);

// 每一页秀 5 笔记录
$pager->Render($rows_per_page=5);
?>


结果如下:

Figure 2. 改变字段名称


15. 输出 CSV 档

ADODB 提供输出 CSV 档的方法,使用前,要将 toexport.inc.php 引入。

<?php

include('adodb/adodb.inc.php');

// 引入输出 CSV 文件功能
include('adodb/toexport.inc.php');

$db = ADONewConnection('mysql');

$mch="localhost";
$user="piza";
$pwd="ooo123";
$database="test";

$db->Connect($mch, $user, $pwd, $database);

$sql = "select name as '姓名', year as '年纪' from t";

$rs = $db->Execute($sql);

// 秀出 CSV 格式
print rs2csv($rs);
?>


结果如下:

姓名,年纪
abcde,45
yyy,20
ppp,34
mmm,13
hhh,41
rrr,65
kkk,29
miso,154
sss,89
abc,18
abcde,0
uyt,58
john,28


也可用 tab 分隔字段,使用 rs2tab 方法如下:

print rs2tab($rs, false);

注: false 表示不显示字段名称

结果如下:

abcde  45
yyy    20
ppp    34
mmm    13
hhh    41
rrr    65
kkk    29
miso   154
sss    89
abc    18
abcde  0
uyt    58
john   28

若是 print rs2tab($rs, true);
结果如下:

姓名    年纪
abcde   45
yyy     20
ppp     34
mmm     13
hhh     41
rrr     65
kkk     29
miso    154
sss     89
abc     18
abcde   0
uyt     58
john    28


也可以将结果由标准输出(STDOUT)显示,使用 rs2tabout 方法如下:

print rs2tabout($rs);


执行结果如下:

Figure 1. 在console中显示结果


也可以存成 CSV 档:

// 档案路径
$path = "/tmp/test.csv";

// 开档供写入
$fhd = fopen($path, "w");

// 若开档成功
if ($fhd) {

   // 则写入 CSV
   rs2csvfile($rs, $fhd);

   // 也可以使用 rs2tabfile($rs, $fhd);

   // 关档
   fclose($fhd);
}

结果如下:

[ols3@p web]$ cat /tmp/test.csv
姓名,年纪
abcde,45
yyy,20
ppp,34
mmm,13
hhh,41
rrr,65
kkk,29
miso,154
sss,89
abc,18
abcde,0
uyt,58
john,28

16. 取出一定笔数的记录 (使用 SelectLimit)

ADODB 提供一个 ADOConnect 函式 SelectLimit,可供您取出一定笔数的记录,用法如下:

$conn->Connect($mch, $user, $pwd, $database);

rs = $conn->SelectLimit("Select * from t", 3, 1);
//                             取出 3 笔、在第 1 笔之后

// 秀出这 3 笔记录
if ($rs) {
    while( $ar = $rs->FetchRow() ) {
        print $ar['name'] ." " . $ar['year'];
        print "<br>\n";
    }

}


上式是说:在第 1 笔记录之后,取出 3 笔,也就是第 2、3、4 笔记录。

结果如下:

--------------------------------------
(mysql): select * from t LIMIT 1,3
--------------------------------------

注意 ! SelectLimit 的写法刚好和 MySQL 语法相反 !

17. 结语

本讲义,主要是为:有心参与 SFS3 (sfs.wpes.tcc.edu.tw) 计划的伙伴们而写的。做为一份入门文件,以上这些介绍,应该是足够让您了解 ADODB 并且能把它应用在 SFS3 或其它有意义的地方了吧? 若果真如此,小弟就心满意足了 !

ref. 参考资源

ADODB 网站

ADODB 手册

PHP 对象导向入门