3.BCD碼
在計算機中,用戶和計算機的輸入和輸出之間要進行十進制和二進制的轉(zhuǎn)換,這項工作由計算機本身完成。在計算機中采用了輸入/輸出轉(zhuǎn)換的二~十進制編碼,即BCD碼。
例如:十進制數(shù)765用BCD碼表示的二進制數(shù)為:0111 0110 0101。
1.5.2 非數(shù)值數(shù)據(jù)的表示
計算機中使用的數(shù)據(jù)有數(shù)值型數(shù)據(jù)和非數(shù)值型數(shù)據(jù)兩大類。數(shù)值數(shù)據(jù)用于表示數(shù)量意義;非數(shù)值數(shù)據(jù)又稱為符號數(shù)據(jù),包括字母和符號等。計算機除處理數(shù)值信息外,大量處理的是字符信息。例如,將用高級語言編寫的程序輸入到計算機時,人與計算機通信時所用的語言就不再是一種純數(shù)字語言而是字符語言。由于計算機中只能存儲二進制數(shù),這就需要對字符進行編碼,建立字符數(shù)據(jù)與二進制串之間的對應(yīng)關(guān)系,以便于計算機識別、存儲和處理。這里介紹兩種符號數(shù)據(jù)的表示。
1.字符數(shù)據(jù)的表示
計算機中用得最多的符號數(shù)據(jù)是字符,它是用戶和計算機之間的橋梁。用戶使用計算機的輸入設(shè)備,輸入鍵盤上的字符鍵向計算機內(nèi)輸入命令和數(shù)據(jù),計算機把處理后的結(jié)果也以字符的形式輸出到屏幕或打印機等輸出設(shè)備上。對于字符的編碼方案有很多種,但使用最廣泛的是ASCII碼(American Standard Code for Information Interchange)。ASCII碼開始時是美國國家信息交換標(biāo)準(zhǔn)字符碼,后來被采納為一種國際通用的信息交換標(biāo)準(zhǔn)代碼。
ASCII碼由0~9這10個數(shù)符,52個大、小寫英文字母,32個符號及34個計算機通用控制符組成,共有128個元素。因為ASCII碼總共為128個元素,故用二進制編碼表示需用7位。任意一個元素由7位二進制數(shù)表示,從0000000到1111111共有128種編碼,可用來表示128個不同的字符。ASCII碼表的查表方式是:先查列(高三位),后查行(低四位),然后按從左到右的書寫順序完成,如B的ASCII碼為1000010。在ASCII碼進行存放時,由于它的編碼是7位,因1個字節(jié)(8位)是計算機中常用單位,故仍以1字節(jié)來存放1個ASCII字符,每個字節(jié)中多余的最高位取0。如表1-7所示為7位ASCII字符編碼表。
(1)打印字符:即從鍵盤輸入并顯示的95個字符,如大小寫英文字母各26個,數(shù)字0~9這10個數(shù)字字符的高3位編碼(D6D5D4)為011,低4位為0000~1001。當(dāng)去掉高3位時,低4位正好是二進制形式的0~9。
(2)不可打印字符:共33個,其編碼值為0~31(0000000~0011111)和(1111111),不對應(yīng)任何可印刷字符。不可打印字符通常為控制符,用于計算機通信中的通信控制或?qū)υO(shè)備的功能控制。如編碼值為127(1111111),是刪除控制DEL碼,它用于刪除光標(biāo)之后的字符。
ASCII碼字符的碼值可用7位二進制代碼或2位十六進制來表示。例如字母D的ASCII碼值為(1000100)2或84H,數(shù)字4的碼值為(0110100)2或34H等。
2.漢字的存儲與編碼
英語文字是拼音文字,所有文字均由26個字母拼組而成,所以使用一個字節(jié)表示一個字符足夠了。但漢字是象形文字,漢字的計算機處理技術(shù)比英文字符復(fù)雜得多,一般用兩個字節(jié)表示一個漢字。由于漢字有一萬多個,常用的也有六千多個,所以編碼采用兩字節(jié)的低7位共14個二進制位來表示。一般漢字的編碼方案要解決4種編碼問題。
(1)漢字交換碼
漢字交換碼主要是用作漢字信息交換的。以國家標(biāo)準(zhǔn)局1980年頒布的《信息交換用漢字編碼字符集基本集》(代號為GB2312-80)規(guī)定的漢字交換碼作為國家標(biāo)準(zhǔn)漢字編碼,簡稱國標(biāo)碼。
國標(biāo)GB 2312-80規(guī)定,所有的國際漢字和符號組成一個94×94的矩陣。在該矩陣中,每一行稱為一個“區(qū)”,每一列稱為一個“位”,這樣就形成了94個區(qū)號(01~94)和94個位號(01~94)的漢字字符集。國標(biāo)碼中有6763個漢字和628個其他基本圖形字符,共計7445個字符。其中規(guī)定一級漢字3755個,二級漢字3008個,圖形符號682個。一個漢字所在的區(qū)號與位號簡單地組合在一起就構(gòu)成了該漢字的“區(qū)位碼”。在漢字區(qū)位碼中,高兩位為區(qū)號,低兩位為位號。因此,區(qū)位碼與漢字或圖形符號之間是一一對應(yīng)的。一個漢字由兩個字節(jié)代碼表示。
(2)漢字機內(nèi)碼
漢字機內(nèi)碼又稱內(nèi)碼或漢字存儲碼。該編碼的作用是統(tǒng)一了各種不同的漢字輸入碼在計算機內(nèi)的表示。漢字機內(nèi)碼是計算機內(nèi)部存儲、處理的代碼。計算機既要處理漢字,又要處理英文,所以必須能區(qū)別漢字字符和英文字符。英文字符的機內(nèi)碼是最高位為0的8位ASCII碼。為了區(qū)分,把國標(biāo)碼每個字節(jié)的最高位由0改為1,其余位不變的編碼作為漢字字符的機內(nèi)碼。
一個漢字用兩個字節(jié)的內(nèi)碼表示,計算機顯示一個漢字的過程首先是根據(jù)其內(nèi)碼找到該漢字字庫中的地址,然后將該漢字的點陣字型在屏幕上輸出。
漢字的輸入碼是多種多樣的,同一個漢字如果采用的編碼方案不同,則輸入碼就有可能不一樣,但漢字的機內(nèi)碼是一樣的。有專用的計算機內(nèi)部存儲漢字使用的漢字內(nèi)碼,用以將輸入時使用的多種漢字輸入碼統(tǒng)一轉(zhuǎn)換成漢字機內(nèi)碼進行存儲,以方便機內(nèi)的漢字處理。在漢字輸入時,根據(jù)輸入碼通過計算機或查找輸入碼表完成輸入碼到機內(nèi)碼的轉(zhuǎn)換。如漢字國際碼(H)+8080(H)=漢字機內(nèi)碼(H)。
(3)漢字輸入碼
漢字輸入碼也叫外碼,是為了通過鍵盤字符把漢字輸入計算機而設(shè)計的一種編碼。
英文輸入時,想輸入什么字符便按什么鍵,輸入碼和內(nèi)碼是一致的。而漢字輸入規(guī)則不同,可能要按幾個鍵才能輸入一個漢字。漢字和鍵盤字符組合的對應(yīng)方式稱為漢字輸入編碼方案。漢字外碼是針對不同漢字輸入法而言的,通過鍵盤按某種輸入法進行漢字輸入時,人與計算機進行信息交換所用的編碼稱為“漢字外碼”。對于同一漢字而言,輸入法不同,其外碼也是不同的。例如,對于漢字“啊”,在區(qū)位碼輸入法中的外碼是1601,在拼音輸入中的外碼是a,而在五筆字型輸入法中的外碼是KBSK。漢字的輸入碼種類繁多,大致有4種類型,即音碼、形碼、數(shù)字碼和音形碼。
2021-07-09
2021-07-08
2021-07-08
2021-07-08
2021-07-08
2021-07-08
2021-07-07
2021-07-07
2021-07-07
2021-07-07
2021-07-07
2021-07-06
2021-07-06
2021-07-06
工作態(tài)度怎么寫 具有穩(wěn)定的工作心態(tài)
2021-07-06
該文觀點僅代表作者本人,查查吧平臺系信息發(fā)布平臺,僅提供信息存儲空間服務(wù),不承擔(dān)相關(guān)法律責(zé)任。圖片涉及侵權(quán)行為,請發(fā)送郵件至85868317@qq.com舉報,一經(jīng)查實,本站將立刻刪除。