情報に関する基本的な考え方についての解説となります。
データ通信の際の基本をしっかり学んでいきましょう!
1. データの最小単位とデジタル化
コンピュータはすべての情報を0と1の組み合わせ(電気のON/OFF)で処理します。
これをデジタル表現と呼びます。
・ビット (bit):情報の最小単位。1ビットで 0 か1の2通りを表現。
・バイト (Byte):8ビットをまとめた単位。2^8 = 256通りの情報を表現可能。
・デジタル化:アナログ情報(連続的な変化)を数値(不連続な数値)に変換すること。
・符号化 (Encoding):一定の規則(文字コードや圧縮形式など)に従って、データ(文字、音、画像など)をコンピュータが扱えるビット列(符号)に変換すること。逆に、符号を元のデータに戻すことを復号 (Decoding) と呼びます。
2.データ圧縮 (Data Compression)
データの意味を保ったまま、サイズを小さくする技術です。
可逆圧縮 (Lossless Compression / 復元可能)
展開(解凍)したときに、完全に元のデータに戻る方式です。
・用途:文書(Word/PDF)、プログラム、ZIP形式。
・重要性: 一文字でも欠けると困るデータに使用します。
非可逆圧縮 (Lossy Compression / 復元不可)
人間の感覚では気づきにくい細かなデータを切り捨て、圧縮率を優先する方式です。
- 用途: 画像(JPEG)、音声(MP3)、動画(MPEG)。
- 重要性: 完全に元には戻りませんが、ファイルサイズを劇的に小さくできます。
ハフマン符号化 (Huffman Coding)
可逆圧縮の代表的なアルゴリズムの一つです。
- 仕組み:出現頻度の高いデータには短い符号を、出現頻度の低いデータには長い符号を割り当てることで、全体のデータ量を削減します。
- ハフマン木: 符号を決定するために作る二分木のことです。
- 特徴:データの偏り(よく使う文字と使わない文字の差)が大きいほど、圧縮効率が高くなります。
3. 誤り制御とパリティチェック
通信中にノイズの影響でデータが化けてしまう(0が1になる等)ことを防ぐ仕組みが誤り制御です。
パリティチェック (Parity Check)
データのビット列に「パリティビット」を 1 ビット付加して、誤りを発見する方法です。
・偶数パリティ:全体の「1」の個数が偶数になるように調整。
・奇数パリティ:全体の「1」の個数が奇数になるように調整。
例(偶数パリティの場合):
・データが
1101001(1 が 4 個) → パリティは0・データが
1101011(1 が 5 個) → パリティは1※ 受信側で「1」の個数を数え、ルール(偶数か奇数か)に反していればエラーと判断します。
※ 注意点:偶数個のビットが同時に反転すると検出できません。
今回のまとめ
| 用語 | 意味 |
|---|---|
| デジタル表現 | コンピュータはすべての情報を0と1の組み合わせ(電気のON/OFF)で処理すること |
| 符号化 | 一定の規則に従って、データをコンピュータが扱えるビット列(符号)に変換すること |
| 可逆圧縮 | 展開(解凍)したときに、完全に元のデータに戻る方式 |
| 非可逆圧縮 | 人間の感覚では気づきにくい細かなデータを切り捨て、圧縮率を優先する方式 |
|
ハフマン符号化 |
出現頻度の高いデータには短い符号を、出現頻度の低いデータには長い符号を割り当てることで、全体のデータ量を削減すること |
| 誤り制御 | 通信中にノイズの影響でデータが化けてしまうことを防ぐ仕組み |
| パリティチェック | データのビット列に「パリティビット」を 1 ビット付加して、誤りを発見する方法 |