假如这个世界上只剩下你一个人,当你正坐在屋子里的时候,这时突然响起了敲门声...

用JavaScript计算字符串占用字节数

上一篇 / 下一篇  2008-05-29 19:35:16 / 个人分类:web

查看( 169 ) / 评论( 0 )
最近和JavaScript纠缠上了。ITPUB个人空间EW?}0fn V
ITPUB个人空间Vn-pSH a
遇到这么一个问题,数据库的字符集为UTF-8的,要在页面上使用JavaScript验证输入的文本用UTF-8存储时占用字节长度。JavaScript的String对象有length属性,但是这个计算的是字符数,不是字节数(问题总是翻来覆去的,记得当年玩Delphi的时候,还得写程序计算字符串的字符数,因为Delphi中String的length是字节数...)。偷懒一点的办法是将验证代码中最大长度设置为数据库中对应字段的长度的1/3,但是这样准确来说有点不合适。
_)G8Zj.h6IYF0
1IHL8m:Ci-y0 所以想办法在JavaScript中判断在UTF-8下存储的String的字节数,在网上找到很多关于Unicode介绍的文档,最重要的是字符编码数值对应的存储长度:
r/P6w/]}LQ h*Gj0
a/O1b zy'_+h g0 UCS-2编码(16进制) UTF-8 字节流(二进制)
H sl1l~+t x0 0000 - 007F 0xxxxxxx (1字节)
b)dy6a#[e2UDK0 0080 - 07FF 110xxxxx 10xxxxxx (2字节)
&d)GRE?6h0 0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx (3字节)
+Ce0p)K[0`Tt[+L0
4e?D]6?0 ITPUB个人空间g:H4W*v;D?

F7A`ene7\t6Y0 于是代码如下:
8~0X X)Im;E}0 ITPUB个人空间&F \S'` y!z(Hj2Wx+P
function mbStringLength(s) {ITPUB个人空间:UDdo.je0S
        var totalLength = 0;ITPUB个人空间e#c.Mk fo W7S
        var i;
2F"f q)qz&k*O7I0         var charCode;
&}k?;e8O$_ VZm!D0         for (i = 0; i < s.length; i++) {
MM4BN t.c \0GP'GR0           charCode = s.charCodeAt(i);ITPUB个人空间5quR:?O/rf%w5N/@[
          if (charCode < 0x007f) {ITPUB个人空间J&|'d8rKvrd%C
            totalLength = totalLength + 1;
FK?&q&k o`0           } else if ((0x0080 <= charCode) && (charCode <= 0x07ff)) {
i5o'}8j2C8N.GU0             totalLength += 2;ITPUB个人空间0{/{Ei#~Wj
          } else if ((0x0800 <= charCode) && (charCode <= 0xffff)) {
d8S6d:Z;f;l#\{*f0             totalLength += 3;
!ng0x ^a0           }ITPUB个人空间 Rol5P8K
        }
$v3Eu-N4OBty0         //alert(totalLength);ITPUB个人空间 Z'~)U"m,\}$[?y3g-[
        return totalLength;
}G6eRo`)Ah0       }ITPUB个人空间'iLX} F'wO

Z&n.{)D O U,w7@[0 ITPUB个人空间O$t Sz%_,n7Y&Ja

}d0c0M?4@4L0 实际上,0x0080到0x07ff之间的字符很少会在实际用户输入中用到。

TAG:

我来说两句

(可选)

日历

« 2008-10-16  
   1234
567891011
12131415161718
19202122232425
262728293031 

数据统计

  • 访问量: 12645
  • 日志数: 119
  • 建立时间: 2008-02-08
  • 更新时间: 2008-10-01

RSS订阅

Open Toolbar