如何正确统计中文字数
如何正确统计中文字数?
如果用strlen的话得到的是不正确的值
假如中英文混合使用的话,如何得到正确的字数呢?
重贴一次:
PHP代码:--------------------------------------------------------------------------------
function ccStrLen($str) #计算中英文混合字符串的长度
{
$ccLen=0;
$ascLen=strlen($str);
$ind=0;
$hasCC=ereg("[xA1-xFE]",$str); #判断是否有汉字
$hasAsc=ereg("[x01-xA0]",$str); #判断是否有ASCII字符
if($hasCC && !$hasAsc) #只有汉字的情况
return strlen($str)/2;
if(!$hasCC && $hasAsc) #只有Ascii字符的情况
return strlen($str);
for($ind=0;$ind<$ascLen;$ind++)
{
if(ord(substr($str,$ind,1))>0xa0)
{
$ccLen++;
$ind++;
}
else
{
$ccLen++;
}
}
return $ccLen;
}
function ccStrLeft($str,$len) #从左边截取中英文混合字符串
{
$ascLen=strlen($str); if($ascLen<=$len) return $str;
$hasCC=ereg("[xA1-xFE]",$str); #同上
$hasAsc=ereg("[x01-xA0]",$str);
if(!$hasCC) return substr($str,0,$len);
if(!$hasAsc)
if($len & 0x01) #如果长度是奇数
return substr($str,0,$len+$len-2);
else
return substr($str,0,$len+$len);
$cind=0;$flag=0;
while($cind<$ascLen)
{
if(ord(substr($str,$cind,1))<0xA1) $flag++;
$cind++;
}
if($flag & 0x01)
return substr($str,0,$len);
else
return substr($str,0,$len-1);
}
__________________
又来这种浪费体力的东西
用mb_strlen() 函数,你们为什么总是不听呢?
<?php
$str = "我中国人a12哈哈";
echo mb_strlen($str);
?>
return 9
__________________
PHP代码:--------------------------------------------------------------------------------
<form name=abc>
<input type=text name=text1 value="asd你" onchange=dd();>
<input type=text readonly name=text2 value="1">
</form>
<SCRIPT Language="JavaScript">
<!--//
function dd(){
document.abc.text2.value=document.abc.text1.value.length;
}
//-->
</SCRIPT>
--------------------------------------------------------------------------------
PHP代码:--------------------------------------------------------------------------------
<?
$text="不要TK别人的内容哦!";
while (eregi ("([a-z])",$text,$regs)) {
$found = $regs[1];
$text = eregi_replace("$found","",$text);
}
echo $text;
?>
--------------------------------------------------------------------------------
输出结果是:不要别人的内容哦!
用ASCII码判断。
<?
$str="abcdefg中华人民共和国中国人民解放军中国共产党中国人民";
$num=strlen($str); //$num字串长度。
echo $num."<br>";
for($i=0;$i<$num;$i++)
if(ord(substr($str,$i,1))>0xa0) $j++;
echo $j/2; //$j/2 汉字数。
?>
应该这样剥除所有字母数字和标点,空格。
代码:--------------------------------------------------------------------------------<?php
$testStr = '我没有告诉你,你就千万不要乱guess, 这样可不good!';
$testStr = eregi_replace("[[:alnum:]]|[[:punct:]]|[[:space:]]",'',$testStr);
echo($testStr);
echo ('字符串中所有中文字数为:'.mb_strlen($testStr));
?>--------------------------------------------------------------------------------
--------------------------------------------------------------------------------
不错的说
稍微改一点点,就可以用了
就是不知道速度如何
PHP代码:--------------------------------------------------------------------------------
function myStrLen($str)
{
$num=strlen($str); //$num字串长度。
for($i=0;$i<$num;$i++)
if(ord(substr($str,$i,1))>0xa0) {$j++;}else{$k++;}
$myStrLen = $j/2+$k;
return $myStrLen;
}
--------------------------------------------------------------------------------
<?php
$str="我是你大,哥.,,he不要和我说.hhhhh在c在有在,在非地膛。以...";
$snum=countstr($str);
echo $snum;
function countstr($str){
$len=strlen($str);
$num=0;
for($i=0;$i<$len;$i++){
if(ord($str[$i])>=161 && ord($str[$i])<=247&& ord($str[$i+1])>=161 && ord($str[$i+1])<=254){
$num++;
$i++;
}
}
return $num;
}
?>
__________________
你想的应该是对的, 但是你有点失误, 比如, 是str而不是title,是>=128而不是>128
我改了一下应该是这样
PHP代码:--------------------------------------------------------------------------------
<?php
$str="asd你asdf我的们kjk 中";
$len=strlen($str);
$num=0;
for ($i=0;$i<$len;$i++) {
if (ord($str[$i]) >= 128) {
$num++;
$i++;
}
}
echo "有".($num)."个中文"
?>
--------------------------------------------------------------------------------
另外混合计算中英文可用下面这个函数, 如有考虑不周之处还请大家指出
PHP代码:--------------------------------------------------------------------------------
<?php
$str = "asd你asdf我的们kjk 中 志";
$len = strlen($str);
$numCn = 0; //中文字符统计
$numEn = 0; //英文字符统计
$numTotal = 0;
for ($i=0; $i<$len; $i++) {
if (ord($str[$i]) > 127) {
$numCn++;
$i++;//略过二字节字符的第二个字节
} else {
$numEn++;
}
}
$numTotal = $numEn + $numCn;
echo "有{$numTotal}个中英文符";
?>
--------------------------------------------------------------------------------