假如这个世界上只剩下你一个人,当你正坐在屋子里的时候,这时突然响起了敲门声...
用JavaScript计算字符串占用字节数
上一篇 /
下一篇 2008-05-29 19:35:16
/ 个人分类:web
查看( 169 ) /
评论( 0 )
最近和JavaScript纠缠上了。
ITPUB个人空间EW?}0fnV
ITPUB个人空间Vn-pSHa
遇到这么一个问题,数据库的字符集为UTF-8的,要在页面上使用JavaScript验证输入的文本用UTF-8存储时占用字节长度。JavaScript的String对象有length属性,但是这个计算的是字符数,不是字节数(问题总是翻来覆去的,记得当年玩Delphi的时候,还得写程序计算字符串的字符数,因为Delphi中String的length是字节数...)。偷懒一点的办法是将验证代码中最大长度设置为数据库中对应字段的长度的1/3,但是这样准确来说有点不合适。
_)G8Zj.h6IY F0
1IHL8m:Ci-y0
所以想办法在JavaScript中判断在UTF-8下存储的String的字节数,在网上找到很多关于Unicode介绍的文档,最重要的是字符编码数值对应的存储长度:
r/P6w/]}LQ h*Gj0
a/O1bzy'_+h
g0
UCS-2编码(16进制) UTF-8 字节流(二进制)
H sl1l~+tx0
0000 - 007F 0xxxxxxx (1字节)
b)dy6a#[e2UDK0
0080 - 07FF 110xxxxx 10xxxxxx (2字节)
&d)GR E?6h0
0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx (3字节)
+Ce0p)K[0`Tt[+L0
4e?D]6?0
ITPUB个人空间g:H4W*v;D?
F7A`ene7\t6Y0
于是代码如下:
8~0X X)Im;E}0
ITPUB个人空间&F
\S'`
y!z(Hj2Wx+P
function mbStringLength(s) {
ITPUB个人空间:UDdo.je0S
var totalLength = 0;
ITPUB个人空间e#c.Mk
fo W7S
var i;
2F"fq)qz&k*O7I0
var charCode;
&}k?;e8O$_
VZm!D0
for (i = 0; i < s.length; i++) {
MM4BN
t.c
\0GP'GR0
charCode = s.charCodeAt(i);
ITPUB个人空间5quR:?O/rf%w5N/@[
if (charCode < 0x007f) {
ITPUB个人空间J&|'d8rKvrd%C
totalLength = totalLength + 1;
FK?&q&k o`0
} else if ((0x0080 <= charCode) && (charCode <= 0x07ff)) {
i5o'}8j2C8N.GU0
totalLength += 2;
ITPUB个人空间0{/{Ei#~Wj
} else if ((0x0800 <= charCode) && (charCode <= 0xffff)) {
d8S6d:Z;f;l#\{*f0
totalLength += 3;
!ng0x^a0
}
ITPUB个人空间Rol5P8K
}
$v3Eu-N4OBty0
//alert(totalLength);
ITPUB个人空间Z'~)U"m,\}$[?y3g-[
return totalLength;
}G6eRo`)Ah0
}
ITPUB个人空间'iLX}F'wO
Z&n.{)D
O
U,w7@[0
ITPUB个人空间O$t Sz%_,n7Y&Ja
} d0c0M?4@4L0
实际上,0x0080到0x07ff之间的字符很少会在实际用户输入中用到。
论坛模式
推荐
收藏
分享给好友
推荐到圈子
管理
TAG: