当前位置:Linux教程 - Php - 如何正确统计中文字数

如何正确统计中文字数

如何正确统计中文字数?    
如果用strlen的话得到的是不正确的值
假如中英文混合使用的话,如何得到正确的字数呢?



重贴一次:

PHP代码:--------------------------------------------------------------------------------
function ccStrLen($str) #计算中英文混合字符串的长度
{
     $ccLen=0;
     $ascLen=strlen($str);
     $ind=0;
     $hasCC=ereg("[xA1-xFE]",$str); #判断是否有汉字
     $hasAsc=ereg("[x01-xA0]",$str); #判断是否有ASCII字符
     if($hasCC && !$hasAsc) #只有汉字的情况
         return strlen($str)/2;
     if(!$hasCC && $hasAsc) #只有Ascii字符的情况
         return strlen($str);
     for($ind=0;$ind<$ascLen;$ind++)
     {
         if(ord(substr($str,$ind,1))>0xa0)
         {
             $ccLen++;
             $ind++;
         }
         else
         {
             $ccLen++;
         }
     }
     return $ccLen;
}
function ccStrLeft($str,$len) #从左边截取中英文混合字符串
{
     $ascLen=strlen($str);   if($ascLen<=$len) return $str;
     $hasCC=ereg("[xA1-xFE]",$str); #同上
     $hasAsc=ereg("[x01-xA0]",$str);
     if(!$hasCC) return substr($str,0,$len);
     if(!$hasAsc)
      if($len & 0x01) #如果长度是奇数
         return substr($str,0,$len+$len-2);
      else
          return substr($str,0,$len+$len);
     $cind=0;$flag=0;
     while($cind<$ascLen)
     {
         if(ord(substr($str,$cind,1))<0xA1) $flag++;
         $cind++;
     }
      if($flag & 0x01)
         return substr($str,0,$len);
      else
          return substr($str,0,$len-1);
}
__________________
又来这种浪费体力的东西    
用mb_strlen() 函数,你们为什么总是不听呢?
<?php

$str
= "我中国人a12哈哈";
echo
mb_strlen($str);

?>

return 9




__________________

PHP代码:--------------------------------------------------------------------------------
<form name=abc>
<input type=text name=text1 value="asd你" onchange=dd();>
<input type=text readonly name=text2 value="1">
</form>
<SCRIPT Language="JavaScript">
<!--//
function dd(){
document.abc.text2.value=document.abc.text1.value.length;
}
//-->
</SCRIPT>
--------------------------------------------------------------------------------

PHP代码:--------------------------------------------------------------------------------
<?
$text
="不要TK别人的内容哦!";
while (
eregi ("([a-z])",$text,$regs)) {
  
$found = $regs[1];
  
$text = eregi_replace("$found","",$text);
}
echo
$text;
?>

--------------------------------------------------------------------------------

输出结果是:不要别人的内容哦!

用ASCII码判断。
<?
$str
="abcdefg中华人民共和国中国人民解放军中国共产党中国人民";
$num=strlen($str); //$num字串长度。
echo $num."<br>";
for(
$i=0;$i<$num;$i++)
if(
ord(substr($str,$i,1))>0xa0) $j++;
echo
$j/2; //$j/2 汉字数。
?>


应该这样剥除所有字母数字和标点,空格。

代码:--------------------------------------------------------------------------------<?php

$testStr
= '我没有告诉你,你就千万不要乱guess, 这样可不good!';
$testStr = eregi_replace("[[:alnum:]]|[[:punct:]]|[[:space:]]",'',$testStr);
echo(
$testStr);
echo (
'字符串中所有中文字数为:'.mb_strlen($testStr));
?>--------------------------------------------------------------------------------

--------------------------------------------------------------------------------


不错的说
稍微改一点点,就可以用了
就是不知道速度如何

PHP代码:--------------------------------------------------------------------------------
function myStrLen($str)
{
    $num=strlen($str); //$num字串长度。
    for($i=0;$i<$num;$i++)
    if(ord(substr($str,$i,1))>0xa0) {$j++;}else{$k++;}
    $myStrLen = $j/2+$k;
    return $myStrLen;
}

--------------------------------------------------------------------------------

<?php
$str
="我是你大,哥.,,he不要和我说.hhhhh在c在有在,在非地膛。以...";
$snum=countstr($str);
echo
$snum;
function
countstr($str){
$len=strlen($str);
$num=0;
for(
$i=0;$i<$len;$i++){
if(
ord($str[$i])>=161 && ord($str[$i])<=247&& ord($str[$i+1])>=161 && ord($str[$i+1])<=254){
$num++;
$i++;
}

}
return
$num;
}
?>


__________________


你想的应该是对的, 但是你有点失误, 比如, 是str而不是title,是>=128而不是>128
我改了一下应该是这样

PHP代码:--------------------------------------------------------------------------------

<?php
$str
="asd你asdf我的们kjk 中";
$len=strlen($str);
$num=0;
for (
$i=0;$i<$len;$i++) {
    if (
ord($str[$i]) >= 128) {
        
$num++;
        
$i++;
    }
}
echo
"有".($num)."个中文"
?>

--------------------------------------------------------------------------------

另外混合计算中英文可用下面这个函数, 如有考虑不周之处还请大家指出

PHP代码:--------------------------------------------------------------------------------

<?php
$str
= "asd你asdf我的们kjk 中 志";
$len = strlen($str);
$numCn = 0;  //中文字符统计
$numEn = 0;  //英文字符统计
$numTotal = 0;
for (
$i=0; $i<$len; $i++) {
    if (
ord($str[$i]) > 127) {
        
$numCn++;
        
$i++;//略过二字节字符的第二个字节
    
} else {
        
$numEn++;
    }
}
$numTotal = $numEn + $numCn;
echo
"有{$numTotal}个中英文符";
?>

--------------------------------------------------------------------------------