漢字編碼,漢字的四種主要編碼為
1、漢字的四種主要編碼為
漢字的四種主要編碼為:外碼、交換碼、機內碼和字形碼。
1、外碼
外碼是用來將漢字輸入到計算機中的一組鍵盤符號。常用的輸入碼有拼音碼、五筆字型碼、自然碼、表形碼、認知碼、區位碼和電報碼等。
2、交換碼
交換碼計算機內部處理信息,用二進制代碼表,需要采用信息交換碼。
3、機內碼
機內碼根據國標碼的規定,每一個漢字都有了確定的二進制代碼,在微機內部漢字代碼都用機內碼,在磁盤上記錄漢字代碼也使用機內碼。
4、字形碼
字形碼是漢字的輸出碼,輸出漢字時都采用圖形方式,無論漢字的筆畫多少,每個漢字都可以寫在同樣大小的方塊中。
漢字編碼的優缺點
1、支持漢字:漢字編碼可以直接表示漢字,無需使用轉義字符或其他方法。
2、兼容性好:漢字編碼在不同的計算機平臺之間兼容性較好,方便在不同的系統之間傳輸和共享文本信息。
3、占用空間大:漢字編碼需要使用較多的碼位來表示漢字,占用空間較大。
4、效率低:漢字編碼的查找和比較效率較低,對于大型文本處理系統的性能有一定的影響。
2、漢字編碼分為哪四種
漢字編碼主要分為四大類:漢字輸入碼、漢字交換碼、漢字內碼和漢字字形碼。
(1)漢字的外部碼
漢字的外部碼簡稱外碼,又叫輸人碼,是輸人漢字的一組鍵盤符號。使用不同的輸入方法,同一漢字的外部碼不同。用戶應選用易記憶、操作簡單、位碼少、重碼少和輸人速度快的外碼。
(2)漢字的內部碼
漢字的內部碼又稱漢字內碼或漢字機內碼。機器接收到外碼后,要轉換成內碼進行存儲、運算和傳送。用二個字節表示漢字的內碼。為了和西文符號區分,內碼的最高位設為“1”。內碼通常用漢字在車庫中的物理位置表示,可以是漢字在字庫中的序號,也可以是字庫中的存儲位置。
(3)漢字交換碼
在計算機之間交換信息時,要求傳送的漢字代碼符合國家規定的交換碼標準,即符合GB2312-80信息交換用漢字編碼集,又稱為國標碼。國標碼收集了7445個圖形字符,其中有6763個漢字和各種符號709個。
(4)漢字字形碼
在顯示或打印漢字時,還涉及到字形碼,又稱輸出碼。漢字字形是指原來鉛字排版漢字的大小和形狀,在計算機中指組成漢字的點陣。
盡管漢字字形有多種變化,筆畫繁簡不一,但都是方塊字且大小相同,都可以寫在同樣的方塊中。把一個方塊看成m行n列矩陣,共有m×n個點,稱為漢字點陣。如16×16點陣的漢字,共有256個點。
漢字編碼
漢字編碼(Chinese character encoding )是為漢字設計的一種便于輸入計算機的代碼。由于電子計算機現有的輸入鍵盤與英文打字機鍵盤完全兼容。因而如何輸入非拉丁字母的文字(包括漢字)便成了多年來人們研究的課題。
漢字信息處理系統一般包括編碼、輸入、存儲、編輯、輸出和傳輸。編碼是關鍵。不解決這個問題,漢字就不能進入計算機。
漢字進入計算機的三種途徑 分別為:
①機器自動識別漢字:計算機通過“視覺”裝置(光學字符閱讀器或其他),用光電掃描等方法識別漢字。
②通過語音識別輸入:計算機利用人們給它配備的“聽覺器官”,自動辨別漢語語音要素,從不同的音節中找出不同的漢字,或從相同音節中判斷出不同漢字。
③通過漢字編碼輸入:根據一定的編碼方法,由人借助輸入設備將漢字輸入計算機。
機器自動識別漢字和漢語語音識別,國內外都在研究,雖然取得了不少進展,但由于難度大,預計還要經過相當一段時間才能得到解決。在現階段,比較現實的就是通過漢字編碼方法使漢字進入計算機。
3、漢字的編碼方式都有哪些?
GB碼:GB碼是1980年國家公布的簡體漢字編碼方案,在大陸、新加坡得到廣泛的使用,也稱國標碼。國標碼對6763個漢字集進行了編碼,涵蓋了大多數正在使用的漢字。
GBK碼:GBK碼是GB碼的擴展字符編碼,對多達2萬多的簡繁漢字進行了編碼,向下與GB碼兼容,簡體版Windows是使用GBK作系統內碼。
BIG5碼:BIG5碼是針對繁體漢字的漢字編碼,目前在臺灣、香港的電腦系統中得到普遍應用,繁體版Windows是用Big5作系統內碼。
Unicode碼:Unicode碼是最新的國際標準編碼,采用二個字節 (16-bit) 編碼,收入了幾乎所有國家的文字符號,適用于所有語言的作業平臺,但與ANSI碼不兼容,只應用于支援Unicode的程式。Unicode Little Endian普遍用于x86系統(ie. Intel),而 Unicode Big )Endian 普遍用于RISC 系統 (ie. Alpha, Mac)。
4、在計算機系統內部使用的漢字編碼是_____?
機內碼。
漢字機內碼,又稱“漢字ASCII碼”,簡稱“內碼”,指計算機內部存儲,處理加工和傳輸漢字時所用的由0和1符號組成的代碼。輸入碼被接受后就由漢字操作系統的“輸入碼轉換模塊”轉換為機內碼,與所采用的鍵盤輸入法無關。
機內碼是漢字最基本的編碼,不管是什么漢字系統和漢字輸入方法,輸入的漢字外碼到機器內部都要轉換成機內碼,才能被存儲和進行各種處理。
漢字進入計算機的三種途徑分別為:
1、機器自動識別漢字
計算機通過“視覺”裝置(光學字符閱讀器或其他),用光電掃描等方法識別漢字。
2、通過語音識別輸入
計算機利用人們給它配備的“聽覺器官”,自動辨別漢語語音要素,從不同的音節中找出不同的漢字,或從相同音節中判斷出不同漢字。
3、通過漢字編碼輸入
根據一定的編碼方法,由人借助輸入設備將漢字輸入計算機。
機器自動識別漢字和漢語語音識別,國內外都在研究,雖然取得了不少進展,但由于難度大,預計還要經過相當一段時間才能得到解決。在現階段,比較現實的就是通過漢字編碼方法使漢字進入計算機。
來源:百度百科—漢字編碼
來源:百度百科—漢字機內碼
請添加微信號咨詢:19071507959
最新更新
推薦閱讀
猜你喜歡
關注我們
