首页 亲,请登录 免费注册

算筹字数统计-最好用的在线字数自动统计工具回到算筹字数统计主页

字数和字符区别,以及其他专业知识

1、位,字,字节,字长,字符串,字符,字数区别及计算方法?



位是信息技术中使用的术语,也称比特(bit)。是最小的信息单位。Bit是二进制数字的缩写(BInarydigiT),因为位实在是太小了,用来表示大数目时不方便,所以有了字节(byte),一个在信息技术和数码技术领域中,用于表示信息的数量的单位。即,一个字节由8个位。


在计算机中,一串数码作为一个整体来处理或运算的,称为一个计算机字,简称字。字通常分为若干个字节(每个字节一般是8位)。在存储器中,通常每个单元存储一个字,因此每个字都是可以寻址的。字的长度用位数来表示。
在计算机的运算器、控制器中,通常都是以字为单位进行传送的。字出现在不同的地址其含义是不相同。例如,送往控制器去的字是指令,而送往运算器去的字就是一个数。
“字”由若干个字节构成,字的位数叫做字长,字长就是说字所对应的二进制数的长度。不同的机器有不同的字长。例如一台8位机,它的1个字就等于1个字节,字长为8位。如果是一台16位机,那么,它的1个字就由2个字节构成,字长为16位。前期的DOS就是8位的,后期的DOS是16位的,Win9X是基于DOS的,所以也是16位的,NT核心的Windows是32位的,现在也有了64位的XP/2003,CPU也有了64位的,这个操作系统和CPU所说的位就是bit的意思,即二进制数的长度。字节是固定由8位二进制构成,64位系统就代表了64位的二进制代表一个字,换算成字节就是64/8=8,即是说由8字节构成一个字,32位系统就是32/8=4,4个字节代表一个字。
如在ARM体系结构中,字的长度为32位,而在8位/16位处理器体系结构中,字的长度一般为16位。

字节
字节(Byte)是计算机信息技术用于计量存储容量和传输容量的一种计量单位,1个字节等于8位二进制。
由字节引申出的计量单位
1kilobyte[kB]=1000(103)byte
1megabyte[MB]=1000000(106)byte
1gigabyte[GB]=1000000000(109)byte
1terabyte[TB]=1000000000000(1012)byte
1petabyte[PB]=1000000000000000(1015)byte
1exabyte[EB]=1000000000000000000(1018)byte
1zettabyte[ZB]=1000000000000000000000(1021)byte
1yottabyte[YB]=1000000000000000000000000(1024)byte
1nonabyte[NB]=1000000000000000000000000000(1027)byte
1doggabyte[DB]=1000000000000000000000000000000(1030)byte
1kibibyte[KiB]=1024(210)byte
1mebibyte[MiB]=1048576(220)byte
1gibibyte[GiB]=1073741824(230)byte
1tebibyte[TiB]=1099511627776(240)byte
1pebibyte[PiB]=1125899906842624(250)byte
1exbibyte[EiB]=1152921504606846976(260)byte
1zebibyte[ZiB]=1180591620717411303424(270)byte
1yobibyte[YiB]=1208925819614629174706176(280)byte
1nobibyte[NiB]=1237940039285380274899124224(290)byte
1dogbibyte[DiB]=1267650600228229401496703205376(2100)byte

字长
字长是直接用二进制代码指令表达的计算机语言,指令是用0和1组成的一串代码,它们有一定的位数,并分成若干字长段,各段的编码表示不同的含义,例如某台计算机字长为16位,即有16个二进制数组成一条指令或其它信息。16个0和1可组成各种排列组合,通过线路变成电信号,让计算机执行各种不同的操作。
字长由微处理器对外数据通路的数据总线条数决定。

字符串
字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为s=“a1a2···an”(n≥0)。它是编程语言中表示文本的数据类型。
通常以串的整体作为操作对象,如:在串中查找某个子串、求取一个子串、在串的某个位置上插入一个子串以及删除一个子串等。两个字符串相等的充要条件是:长度相等,并且各个对应位置上的字符都相等。设p、q是两个串,求q在p中首次出现的位置的运算叫做模式匹配。串的两种最基本的存储方式是顺序存储方式和链接存储方式。

字符
字符(Character)是指人类语言最小的表义符号。
字符是指计算机中使用的字母、数字、字和符号,包括:1、2、3、A、B、C、~!·#¥%……—*()——+等等。1个汉字字符存储需要2个字节,1个英文字符存储需要1个字节。例如在VB中求字符串的长度时,len(str(1234))=4。
字符是可使用多种不同字符方案或代码页来表示的抽象实体。例如,UnicodeUTF-16编码将字符表示为16位整数序列,而UnicodeUTF-8编码则将相同的字符表示为8位字节序列。公共语言运行库使用UnicodeUTF-16(Unicode转换格式,16位编码形式)表示字符。
针对公共语言运行库的应用程序使用编码将字符表示形式从本机字符方案映射至其他方案。应用程序使用解码将字符从非本机方案映射至本机方案。
电脑和通讯设备会使用字符编码的方式来表达字符。意思是指,会将一个字符指定给某个东西。传统上,是代表整数量的位元序列,如此,则可透过网络来传输,同时亦便于储存。两个常用的例子是ASCII和用于统一码的UTF-8。根据谷歌的统计,UTF-8是目前最常用于网页的编码方式。[1]相较于大部分的字符编码把字符对应到数字或位元串,摩斯密码则是使用不定长度的电子脉冲的序列来表现字符。

字数
不管书中标题多大,插图多少,都按横格字数乘每页行数乘总页数求出全书字数。若全页都是照片或插图,则不算字数。
字数计算有两种方法,一是包含符号,一是不含符号。

2、网页编码中,一个汉字占多少字节?


GBK编码,一个汉字占两个字节。
UTF-16编码,通常汉字占两个字节,CJKV扩展B区、扩展C区、扩展D区中的汉字占四个字节(一般字符的Unicode范围是U+0000至U+FFFF,而这些扩展部分的范围大于U+20000,因而要用两个UTF-16)。
UTF-8编码是变长编码,通常汉字占三个字节,扩展B区以后的汉字占四个字节。

3、wore中如何空两个字?


word文档中按几下空格键就等于两个汉字的长度?
一般首行缩进2个字符,1汉字=2字符,也可以在了段落前点击右键-段落-缩进和间距-4字符。

4、小说中的字数?


短篇小说:字数以五千至一万五千字为原则。
中篇小说:字数以三万至七万字为原则。
中长篇小说一般没有明确的字数规定, 但作为严格的出版部门,一般以字数在8万以上。作为长篇小说, 2万-6万字或4万-8万字或者更低一些称为中篇小说。
微型小说,指的是篇幅微小,不超过一千五百个字。

5、短信和微博最长能发多少字?


目前每单位短信最多是140个英文字符/70个汉字符,超过这个的手机将自动分割成相应条数(按条数收费),并在收件人的手机上自动组合。
如果字数太多的话,比如1000个汉字,建议使用彩信进行发送(如果双方都支持彩信的话),这样会比较划算,因为单位彩信的文字最大容量是1000个中文字符。一条彩信=?条普通短信。
微博之所以要限定140个字符,就是源于从手机发短信最多的字符就是140个,根据人眼一次性识别内容的物理特性定的。更为了手机发布阅读方便。

6、小说或者投稿如何计字数?


字数不包括标点;字符数(不计空格)包括标点,不包括空格;字符数(计空格)既包括标点,也包括空格。
考试作文计字数的话,不包括空格和标点,算字数。
向出版社、报社投稿的话,包括空格和标点,算字符数(计空格)。
根据国家1996年颁布的《标点符号用法》,常用的标点符号有16种:句号、问号、叹号、逗号、顿号、分号、冒号、引号、括号、破折号、省略号、着重号、连接号、间隔号、书名号和专名号。没有空格。所以不算标点符号。


技术支持 Email:goosui@qq.com    网站备案号: 粤ICP备20037280号