任务三:信息的表示与存储
C任务描述
小张想通过自学编程最终成为一名高手。目前,他对信息的表示与存储等相关知识充满着好奇,如数据与信息是什么,它们之间的区别与联系有哪些,计算机如何表示各种数,又有哪些数据单位,各种进制数间如何相互转换,字符的编码……他通过查阅资料,逐渐掌握了这部分重要的入门知识。
C学习目标
知识目标 |
能力目标 |
素质目标 |
1.了解计算机内的信息表示 2.学会进制数间转换 3.掌握字符编码 |
1.能应用信息的表示方法和编码
|
1. 养成利用技术形成创新学习能力的意识 2. 培养学生文明上网的意识 |
C知识储备
知识点1:了解数据与信息的概念,及学习它们的区别
1. 数据的概念
数据是指数字、文字、字母、图形、图像、视频、音频等,也是客观事物的属性、数量、位置及其相互关系的抽象表示。例如,票房和电视收视率、教师学生的档案记录、快递信息、股票行情、高铁动车的时刻表及票价等都是数据。
在计算机科学中,数据是指所有能输入到计算机并被计算机程序处理的符号的介质的总称,是用于输入电子计算机进行处理,具有一定意义的数字、字母、符号和模拟量等的通称。
2. 信息的概念
经过加工处理后用于人们决策或具体应用的数据称作信息。例如,人们通过对火车时刻表和票价的分析,作为购票的依据。
信息是人们用以对客观世界直接进行描述、可以在人们之间进行传递的知识或事实。
3. 联系与区别
信息与数据既有联系,又有区别。数据是信息的载体,而信息是数据的具体表现形式,信息是加载于数据之上,对数据作具有含义的解释。
数据和信息是不可分离的,信息依赖数据来表达,数据则生动具体表达出信息。数据是符号,是物理性的,信息是对数据进行加工处理之后所得到的并对决策产生影响的数据,是逻辑性和观念性的。计算机可以处理的信息源有:字符、数字和各种数学符号、图形、图像、音频、视频和动画等。这些可以识别的记号或符号都称为数据,它们的各种组合用来表达客观世界中的各种信息。
【小贴士】
随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。经李克强总理签批,2015年9月,国务院印发《促进大数据发展行动纲要》,系统部署大数据发展工作。请您上网搜索 “大数据”,了解它的概念、特征、应用、意义和趋势。
知识点2:计算机中数据的单位
计算机中的信息用二进制表示,常用的单位有位、字节和字。
位(bit,又称比特):简写为b,计算机中最小的数据存储单位。一个二进制位只能表示0或1两种状态。
字节(Byte):简记为B,计算机中表示存储容量的基本单位。一个字节由8位二进制数组成。一般情况下,一个ASCII码占用一个字节,一个汉字国际码占用两个字节。此外还有KB(千字节)、MB(兆字节)、GB(吉字节)、TB(太字节)、PB(拍字节)等,它们之间的换算关系如下:
1Byte=8bit 1KB=1024B 1MB=1024KB 1GB=1024MB 1TB=1024GB 1PB=1024TB
字(Word)与字长:字是指在计算机中作为一个整体被存取、传送、处理的一组二进制数。一个字的位数(即字长)是计算机系统结构中的一个重要特性。字长是由CPU的类型所决定,不同的计算机系统的字长是不同的,常见的有8位、16位、32位、64位等。字长是计算机性能的一个重要指标,字长越长,计算机一次处理的信息位就越多,精度就越高,目前主流微机是64位机。
注意字与字长的区别,字是单位,而字长是指标。
C练一练
1.手机内存64GB表示容量约为______。
A、64亿个字节 B、64亿个二进制位 C、640亿个字节 D、640亿个二进制位
2.下列不能用作存储容量单位的是______。
A、ByteB、GBC、MIPSD、KB
3. 若对音频信号以10kHz采样率、16位量化精度进行数字化,则每分钟的双声道数字化声音信号产生的数据量约为______。
A、1.2MBB、1.6MBC、2.4MBD、4.8MB
4.假设某台计算机的内存容量为8GB,硬盘容量为2TB。硬盘容量是内存容量的______。
A、100倍B、128倍C、200倍D、256倍
知识点3:各进制数间的相互转换
1.数制(计数制)的概念
数制是人们利用符号来计数的科学方法,有非进位数制和进位数制。如罗马数字就是非进位数制。进位数制指的是按进位方式计数的数制,如十进制、二进制和十六进制。
进位计数制的两个基本要素:
基数——指在某种进位计数制中,每个数位上所能使用的数码的个数。例如,二进制的基数为2;十进制的基数为10。
位权——数制中某一位上的1所表示数值的大小(所处位置的价值)。例如,十进制的365,3的位权是102=100,6的位权是101=10,5的位权是100=1。二进制中的1101,第一个1的位权是23=8,第二个1的位权是22=4, 0的位权是21=2,第三个1的位权是20=1。
位权 |
23 |
22 |
21 |
20 |
二进制数 |
1 |
1 |
0 |
1 |
2. 几种常用的进位计数制
(1) 二进制(2)八进制(3)十进制(4)十六进制
数制 |
数码 |
进位 |
基数 |
位权 |
数的表示 |
二进制 |
0、1 |
逢2进位 |
2 |
23 22 21 20 2-1 2-2 |
(R)2、RB |
八进制 |
0~7 |
逢8进位 |
8 |
83 82 81 80 8-1 8-2 |
(R)8、RQ |
十进制 |
0~9 |
逢10进位 |
10 |
103 102 101 10010-110-2 |
(R)10、RD、R |
十六进制 |
0~9、A~F |
逢16进位 |
16 |
163 162 161 160 16-1 16-2 |
(R)16、RH |
3.二进制、八进制、十进制、十六进制的关系表
十进制 |
二进制 |
八进制 |
十六进制 |
0 |
0000 |
0 |
0 |
1 |
0001 |
1 |
1 |
2 |
0010 |
2 |
2 |
3 |
0011 |
3 |
3 |
4 |
0100 |
4 |
4 |
5 |
0101 |
5 |
5 |
6 |
0110 |
6 |
6 |
7 |
0111 |
7 |
7 |
8 |
1000 |
10 |
8 |
9 |
1001 |
11 |
9 |
10 |
1010 |
12 |
A |
11 |
1011 |
13 |
B |
12 |
1100 |
14 |
C |
13 |
1101 |
15 |
D |
14 |
1110 |
16 |
E |
15 |
1111 |
17 |
F |
数在计算机中是以二进制形式表示的。数分为有符号数和无符号数。一个字长为5位的无符号二进制数能表示的十进制数值范围是0 ~31(提示:5位的无符号二进制数范围00000 ~11111,转换成十进制数即为 0 ~31)。
4.进制之间的相互转换
(1)非十进制转换为十进制数
方法:按相应的权展开求和
例1:将二进制数101101.11转换成十进制
(101101.11)B=1×25+0×24+1×23+1×22+0×21+1×20+1×2-1+1×2-2=32+8+4+1+0.5+0.25=(45.75)D
例2:将十六进制数2BE.4转换成十进制数
2BE.4H=2×162+11×161+14×160+4×16-1
=512+176+14+0.25=(702.25)D
(2)十进制转换成非十进制数
整数部分:除模取余法,直到商为0,最后一项余数为所求进制数最高位
小数部分:乘模取整,所得整数为所求进制小数的最高位,直到乘积全部为整数
例3:将十进制数14.625转换成二进制数
整数部分 小数部分
2 14 ……0 0.625
2 7 ……1 × 2
2 3 ……1 1.25 ……1
2 1 ……1 × 2
0 0.5……0
× 2
1 ……1
(14.625)10=(1110.101)2
例4:将十进制数985.3203125转换成十六进制数
整数部分 小数部分
16 985 ……9 0. 3203125
16 61 ……13 × 16
16 3 ……3 5.125 ……5
0 × 16
2……2
(985.3203125)10=(3D9.52)16
(3)二进制数与十六进制数间的相互转换
A.十六进制数转换成二进制数,将十六进制数中每位数字都分别用其对应的四位二进制数表达即可
B.二进制数转换成十六进制数,将整数部分自右向左,小数部分自左向右,每四位划为一段,不足四位补0,并将每段分别用一位十六进制数表示。
例5:将二进制数10100111.10011101转换成十六进制数
(10100111.10011101)2=(A7.9D)16
例6:将十六进制数据89B.3A转换成二进制数
(1D5.C3)16=(000111010101.11000011)2=(1 1101 0101.11000011)2
C练一练
1. 在八进制中,数用0到______这八个符号来描述。计数规则是逢_______进一。
2. 在一个非零无符号二进制整数之后添加一个0,则此数的值为原数的______倍。
A、4B、2C、1/2D、1/4
3. 在一个非零无符号二进制整数之后去掉两个0,则此数的值为原数的______倍。
A、4 B、2 C、1/2 D、1/4
4. 一个字长为8位的无符号二进制整数能表示的十进制数值范围是______。
A、0-256 B、0-255 C、1-256 D、1-255
5. 一个字长为6位的无符号二进制数能表示的十进制数值范围是______。
A、0-64 B、1-64 C、1-63 D、0-63
6. 下列两个二进制数进行算术加运算,100001 + 111 = ______。
A、101110B、101000C、101010D、100101
7. 十进制数 111 转换成二进制数是______。
A、1111001B、01101111C、01101110D、011100001
8. 十进制数是 56 对应的二进制数是______。
A、00110111B、00111001C、00111000D、00111010
9. 二进制数 1001001 转换成十进制数是______。
A、72B、71C、75D、73
10. 下列叙述中,正确的一条是______。
A、十进制数101的值大于二进制数1000001
B、所有十进制小数都能准确地转换为有限位的二进制小数
C、十进制数55的值小于八进制数66的值
D、二进制的乘法规则比十进制的复杂
知识点4:字符的编码
1.编码和解码
计算机中储存的信息都是用二进制数表示的;而我们在屏幕上看到的英文、汉字等字符是二进制数转换之后的结果。通俗的说,按照何种规则将字符存储在计算机中,如'a'用什么表示,称为"编码";反之,将存储在计算机中的二进制数解析显示出来,称为"解码",如同密码学中的加密和解密。在解码过程中,如果使用了错误的解码规则,则导致'a'解析成'b'或者乱码。
2.字符集
字符集(Charset):是一个系统支持的所有抽象字符的集合。字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。
常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。
3. ASCII
ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。字符集有共有128种常用字符,有数字0-9、大小写英文字母、通用符号和控制符号。ASCII字符用七位编码,允许加一位奇偶校验位(最高位)构成一个字节。请自行网上搜索ASCII表。
大小规则:
1)数字0~9比字母要小。如"5"<"G";
2)数字0比数字9要小,并按0到9顺序递增。如"4"<"9"
3)字母A比字母Z要小,并按A到Z顺序递增。如"A"<"Z"
4)同个字母的大写字母比小写字母要小。如"A"<"a"。
4. GB2312
《信息交换用汉字编码字符集》是由中国国家标准总局1980年发布,1981年5月1日开始实施的一套国家标准,标准号是GB 2312—1980。
GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。
基本集共收入汉字6763个(其中一级汉字3755个,二级汉字3008个)和非汉字图形字符682个。整个字符集分成94个区,每区有94个位。每个区位上只有一个字符,因此可用所在的区和位来对汉字进行编码,称为区位码。
把换算成十六进制的区位码加上2020H,就得到国标码。国标码加上8080H,就得到常用的计算机机内码。1995年又颁布了《汉字编码扩展规范》(GBK)。
5. 编码之间的关系
信息交换用汉字编码字符集和汉字输入编码之间的关系是,根据不同的汉字输入方法,通过必要的设备向计算机输入汉字的编码,计算机接收之后,先转换成信息交换用汉字编码字符,这时计算机就可以识别并进行处理;汉字输出是先把机内码转成汉字编码,再发送到输出设备。
汉字输入 汉字输出
说明:
(1) 汉字输入码是为将汉字输入计算机而编制的代码称为汉字输入码,也叫外码。
(2) 汉字信息交换码(国标码):国标码GB2312-80:用于汉字信息处理系统之间或者通信系统直接进行信息交换的汉字代码,简称交换码,也叫国际码。
(3) 汉字内码:在计算机内部队汉字进行存储、处理和传输汉字代码。
汉字的内码=汉字的国标码+8080H
即将国际码的每个字节的最高位置变成1。
(4) 汉字字形码(点阵形)
如采用24*24点阵,每个汉字的存储空间 24*24/8=72字节
C练一练
1. 已知某汉字的区位码是3222,则其国标码是
提示:①先将区号和位号分别转换成十六进制数,②分别将区号和位号加20H
2. 已知某一个汉字的国标码是5E38H,则其内码是
提示:机内码是国标码的两个字节最高位分别加1,即国标码的两个字节最高位分别+80H得到机内码
3. 在下列字符中,其ASCII码值最大的一个是(备选项:9 Z d X )
提示:在ASCII码表中,根据码值由小到大的排列顺序是:控制符、数字符、大写英文字母、小写英文字母
4. 根据汉字国标码GB2312-80的规定,将汉字分为常用汉字和次常用汉字两级,次常用汉字的排列次序是按_________。
提示:按照使用的频率分为:一级常用汉字3755个,按汉语拼音字母顺序排列; 二级次常用汉字3008个,按部首排列。
5.在标准ASCII编码表中,数字码、小写英文字母和大写英文字母的前后次序是_______。
A、数字、小写英文字母、大写英文字母
B、小写英文字母、大写英文字母、数字
C、数字、大写英文字母、小写英文字母
D、大写英文字母、小写英文字母、数字
6. 在标准ASCII码表中,已知英文字母A的十进制码值是65,英文字母a的十进制码值是______。
A、95B、96C、97D、91
7. 在标准ASCII码表中,已知英文字母K的十六进制码值是4B,则二进制ASCII码1001000对应的字符是______。
A、GB、HC、ID、J
8.无符号二进制整数1001001转换成十进制数是______。
A、72B、71C、75D、73
9.在下列关于字符大小关系的说法中,正确的是______。
A、空格>7>a>A B、空格>7>A>a C、a>A>7>空格D、A>a>7>空格
10.字符比较大小实际是比较它们的ASCII码值,下列正确的是______。
A、'A'比'B'大B、'H'比'h'小C、'F'比'D'小 D、'9'比'D'大
11.一个汉字的国标码用2个字节存储,其每个字节的最高二进制位的值分别为______。
A、0,0 B、1,0 C、0,1 D、1,1
12.下列叙述中,正确的是______。
A、一个字符的标准ASCII码占一个字节的存储量,其最高位二进制总为0
B、大写英文字母的ASCII码值大于小写英文字母的ASCII码值
C、同一个英文字母(如A)的ASCII码和它在汉字系统下的全角内码是相同的
D、一个字符的ASCII码与它的内码是不同的。
13.已知字符A的ASCII码是01000001B,字符D的ASCII码是______。
A、01000011B B、01000100B C、01000010B D、01000111B
14.在标准ASCII码表中,英文字母a和A的码值之差的十进制值是______。
A、20B、32C、-20D、-32
15. 在计算机中,对汉字进行传输、处理和存储时使用汉字的______。
A、字形码 B、国标码 C、输入码 D、机内码
16.显示或打印汉字时,系统使用的是汉字的______。
A、机内码 B、字形码 C、输入码 D、国标交换码
17. 根据汉字国标GB2312-80的规定,二级次常用汉字个数是______。
A、3000个 B、7445个C、3008个 D、3755个
C任务实施
1.请归纳“R进制→十进制、十进制→R进制”的转换规律。
2. 请你们用百度查询“Unicode编码”和“UTF-8编码”,并尝试用在线编码工具实现相互转换。
3. 请百度查询“#FF0000”、“#00FF00”和“#0000FF”分别表示什么颜色,并尝试用在线配色找到你喜欢的颜色,用这种十六进制格式记录下来。
C任务评价
任务完成情况 |
自我评价 |
小组评价 |
进制的转换规律 |
□完成□待完善原因: |
☆☆☆☆☆ |
编码的转换 |
□完成□待完善原因: |
☆☆☆☆☆ |
颜色的配置 |
□完成□待完善原因: |
☆☆☆☆☆ |
C拓展与提高
1.计算机中的符号数有三种表示方法,即原码、反码和补码。
三种表示方法均有符号位和数值位两部分,符号位都是用0表示“正”,用1表示“负”,而数值位,三种表示方法各不相同。在计算机系统中,数值一律用补码来表示和存储。原因在于,使用补码,可以将符号位和数值域统一处理;同时,加法和减法也可以统一处理。此外,补码与原码相互转换,其运算过程是相同的,不需要额外的硬件电路。
(1)原码——正数的符号位为0,负数的符号位为1,数值位是真值的绝对值
(2)反码——正数的符号位为0,数值位取真值,负数的符号位为1,数值位取真值的绝对值的相反码
(3)补码——正数的符号位为0,数值位取真值,负数的符号位为1,数值位取真值的相反码加1
真值 |
机器数 |
原码 |
反码 |
补码 |
+18 |
00010010 |
00010010 |
00010010 |
-18 |
10010010 |
11101101 |
11101110 |