情報リテラシ第一 第6回
2020年6月8日 (月) 1-2限
- 前回までのあらすじ
- コンピュータの原理 (復習)
- データの情報量
- データ圧縮とは
- インターネットの仕組み (復習)
- 本日のまとめ・小課題
- クラス共通課題2の説明
- 次回予告
雑談:
知っておくとネタにできる心理学の有名な実験:
- アッシュの協調実験
人は (あきらかに間違っていても) 他人の意見に同調してしまう。
- ミルグラム実験
「偉い人」に命令されると、人は残酷な命令でも従ってしまう。
- スタンフォード監獄実験
単に制服を変えただけで、人格が変わってしまう。
- モンスター実験
批判的な環境のもとでは誰もが失敗するようになる。
- マシュマロ実験
辛抱づよい子供は、大人になっても成功する。
- ロバーズ・ケイブにおける実験
「ただ物理的に離れている」だけで敵意が生まれる。
- 青い目・茶色の目実験
自分がダメだと思わされていると、本当にダメになる。
- 学習的無力感の実験
「自分はこの状況から抜け出せる」と思っているだけで、症状が軽減する。
- 選択的注意実験
人はボールが何回パスされたかを数えられるか?
連絡事項
0. 前回までのあらすじ
- 研究とは、調べることである。
- 真実 = 資料・論文。
- Wikipedia は、疑ってかかるべし。
- じつは著作権は、世の中を楽しくするための権利だった。
- コンピュータの4大装置とは何か?
- コンピュータ上では、あらゆる情報は「?」と「?」のみで表される。
- 「1ビット」とは何か説明せよ。
- 「1バイト」とは何か説明せよ。
1. コンピュータの原理 (復習)
- すべてのコンピュータは4つの装置から成り立っている:
- コンピュータにとって、地球上のすべての機械は
ただの入出力装置である (人間を含む)。
- あらゆる情報 (= 文字・画像・音声・動画など) は、
すべて 2種類の異なる状態の組み合わせで表される:
- 電圧の高(5V)/低(0V)
- スイッチの入/切
- 0 と 1
2. データの情報量
コンピュータでは、おもに以下のようなデータを扱う:
- 数値
- 文字(列) / テキスト (text)
- 静止画像
- 音声
- 動画
2.1. 数値 (整数) を 0 と 1で表すには
- 10種類の数字を使う: 10進数 (ふつうの数)
- 8種類の数字のみ使う: 8進数
- 2種類の数字のみ使う: 2進数 … 0 と 1 のみで数を表現する。
n桁の2進数 = 2n通りの数を表現可能。
2.2. 文字を 0 と 1で表すには
- 1文字 = 1つの数値で表わす。
数値を並べれば文章が表現できる。
- ASCII 方式 (国際規格): A=65, B=66, C=67, ...
- いろいろな規格:
文字データの問題点
- 問. 以下の2進数を文字として解読したら?
"10001101111100 10010111011100
"
- JIS X 0208 の文字として解釈すると…
「日本」
- GB 2312 の文字として解釈すると…
「泣塑」 (文字化け)
- どっちの方式かわからないと、正しく解釈できない!
2.3. 文字の情報量
文字の情報量 = (文字数) × 3バイト
- 1文字 = Unicodeで表すと約24ビット = 3バイト
- メール1000文字 = 3000バイト
- 新約聖書 = 約40万文字 = 120万バイト
- 夏目漱石「坊っちゃん」は約4万文字ある。これを表すのに必要な情報量は何バイトか。
- Wikipedia日本語版における文章部分のみを合計すると、約50億文字になる。
これを表すのに必要な情報量は何ギガバイトか。
2.4. 画像を 0 と 1で表すには
白黒の画像を表す情報量 = (縦ピクセル数) × (横ピクセル数) ビット
2.5. 色を 0 と 1で表すには
1つの色を表す情報量 = 3バイト
- 色とは何か?
- 錐体細胞 (色を認識する -
赤、
緑、
青のあたりにピークがある)
-
R,
G,
B
の各成分をそれぞれ 256段階 (8ビット = 1バイト) の数値で表す
= 256×256×256種類 (3バイト) あれば色が表現可能
これをピクセルの数だけ並べれば画像が表現できる。
2.6. 画像の情報量
カラー画像の情報量 = (縦ピクセル数) × (横ピクセル数) × 3バイト
- Twitterのアイコン (64×64ピクセル): 64×64×3 = 12288バイト
- 画像は情報量が多い。
- HD解像度の映像は、1920×1280ピクセルある。
この一枚の画像を表すのに必要な情報量は何バイトか。
- iPhone X のカメラは、12Mピクセルの画素をもっている。
これで撮影した一枚の写真を表すのに必要な情報量は何バイトか。
また、これは新約聖書 (120万バイト) のおよそ何倍か。
2.7. 音声を 0 と 1で表す
音声の情報量 = (秒数) × (チャンネル数) × 88,000バイト
- 音とは何か?
- 波形の形を数値の列によって表す:
10, 25, 35, 40, 45, 40, 35, ...
- 人間の可聴領域: 20Hz 〜 20,000Hz。
- CD音質の音 (モノラル): 44,100Hz (44.1KHz)
波形の1成分を 0 〜 65535 (16ビット) で表すと、
44KHz×2バイト = 88,000バイト/秒。
2.8. 動画の情報量
動画の情報量 = (1コマ分の画像の情報量) × (コマ数)
- HD画質で毎秒30コマ:
1920×1280×3×30 = 186,624,000バイト/秒 = 186Mバイト/秒
- 4K画質で毎秒60コマで1時間の動画:
3840×2160×3×60×3600 = 5,374,771,200,000バイト = 5000Gバイト
- 動画は非常に情報量が多い。
- HD画質で毎秒30コマの映像 1時間分は何バイトか。
- a. の映像にモノラル 44.1KHz の音声がついていると仮定すると、
合計で何バイトになるか。
2.9. データの「形式」とは
- データ形式・ファイル形式 …
その 0と1 を、どのように解釈するか。
形式がわからないと、データは正しく表示できない
(文字化けに似ている)。
- 実験:
- パソコン上で、なんらかの画像ファイルをさがす。
- ファイル名を「
.jpg
」などから「.txt
」に変換し、
それをメモ帳で開く。
3. データ圧縮とは
- 携帯のデータ通信料: 月20GB で 6000円〜。
- データ通信料のめやす
「こんな大量のデータを扱うのはイヤだ」
- データ量を減らす技術: データ圧縮
3.1. データ圧縮技術の種類
- 可逆圧縮 … もとに戻る (可逆) 圧縮。
PNG画像 (くり返しを省く)
- 非可逆圧縮 … 完全にはもとに戻らない (非可逆) 圧縮。
JPEG画像 (人間が気づかない部分を省く: 約1/10倍)
MPEG動画 (変化しない部分を省く: 約1/100倍)
3.2. 圧縮による情報量の削減
データ圧縮技術は、こんにちデータを送受信する際にはほぼ必須となっている。
4. インターネットの仕組み (復習)
- 今日、多くのデータはネットワークからダウンロードされている。
- コンピュータから見ると、ネットワークは巨大な入出力装置である。
4.1. どうやって通信するのか?
線は一本しかないのに、複数のコンピュータが同時に通信できる。
→ パケット交換
4.2. サーバとクライアント
ネットワークにつながっているコンピュータには2種類ある:
- クライアント (客) … 勝手な時間に来店する。
例: スマートフォン, PC, 冷蔵庫, ...
- サーバ (店) … 24時間つねに開店している。
例: ルータ, 箱(のようなもの)
- サーバには、名前がついている。
(
www.titech.ac.jp
とか)
4.3. IPアドレスとは
- インターネットにつながっているすべてのコンピュータが持つ固有のアドレス。
- 8ビット(0〜255) × 4つの数字で表される。
- 49.212.234.52
- 131.112.244.84
- ...
- 原則、同じアドレスは世界中に2つと存在しない。
4.4. 実際のパケット
- ケーブルの中には、複数のデータ (IPパケット) が流れている。
- 各IPパケットには、行き先をあらわす IPアドレス がついている。
- データの種類は、各パケットにつけられた「ポート番号」および
「通信手順 (プロトコル)」で区別する。
- 電子メール… SMTP (Simple Mail Transfer Protocol, ポート番号 25)
- ウェブページ… HTTP (Hyper Text Transfer Protocol, ポート番号 80)
- ウェブページ(暗号化)… HTTPS (Hyper Text Transfer Protocol Secure, ポート番号 443)
4.5. URLとは?
- ブラウザの上に表示されている文字列。
"Uniform Resource Locator" の略だが、
「ゆーあーるえる」または単に「ウェブページのアドレス」と呼ばれる。
- インターネット上のデータ (資源) を特定するのに使われる:
https | :// | www.titech.ac.jp | | /education/index.html |
プロトコル名 | | サーバのIPアドレス | | ファイル名 |
4.6. Domain Name System (DNS)
- 数字だけの (
131.112.244.84
のような)
IPアドレスは覚えにくいので、
www.titech.ac.jp
のような「名前」から
IPアドレスを解決する仕組み。
- たとえば、以下の2つのURLは同じである:
-
http://vc55.tabesugi.net/
-
http://166.84.7.55/
- 電子メールでも使われる:
dareka.aaa@m.titech.ac.jp
(メールサーバのIPアドレス)
- IPアドレスが見つからない場合はエラー。
- 例:
oosamanomimiharobanomimi.com
- 例:
www.igakubu.titech.ac.jp
パソコンには、インターネット上にある特定のサーバが
本当に応答しているか否かを検査するプログラム "ping
" が附属している。
ここではそれを使って、実際にいくつかのサーバの応答を検査してみる。
- パソコンで「
コマンド プロンプト
」
(Mac の場合は、「ユーティリティ
」フォルダ内にある「ターミナル
」)
アプリを起動せよ。
- 以下のコマンドを入力し、Enter を押せ:
(コマンドが無反応になった場合は、Ctrl
+ C
を押して止める。)
-
ping 127.0.0.1
(自分自身の PC の応答をチェックする)
-
ping 198.41.0.4
(世界にあるルートサーバの 1つをチェックする)
-
ping a.root-servers.net
(b. と同じサーバをチェックするが、IPアドレスではなく名前で指定する)
- アプリの実行方法がわからない場合は、ウェブサイト
https://pingtool.org/ を使ってもよい。
4.7. World Wide Web (WWW) の動き
- ブラウザに URL "
https://www.titech.ac.jp/
" が入力される。
- クライアント (PC) が DNS サーバを使って、この名前を IPアドレス (131.112.244.84) に変換する。
- クライアントが指定されたIPアドレスの WWW サーバにパケットを送る。(HTTP)
- HTMLファイルがサーバからクライアントに送られる:
<!DOCTYPE html>
<html lang="ja">
<title>東京工業大学</title>
<a href="/entrance_information/">入試情報</a>
<a href="/maps/index.html">アクセス</a>
...
- ブラウザがデータを画面上に表示する。
- ユーザがリンクをクリックすると、そのリンク先の URL を使って 2. に戻る。
以下の質問について ○ か × かを答えよ。
- 文字だけのページよりも画像が沢山使われているページのほうが、通信量が多い。
- アドレスに ".jp" がついているサーバは、必ず日本国内にある。
- ブラウザがページを表示している間ずっと、通信が発生している。
4.8. ブラウザがうまく動かない場合
- URL の形式がおかしい。
例: moo://w4i♥zqs♪x>よ-\o/-
- 名前から IPアドレスが変換できない。
例: http://oosamanomimiharobanomimi.com/
- ケーブルが切れている・パケットが到達できない。
例: http://10.10.10.10/
- サーバの電源が切れている。
例: http://192.168.xxx.xxx/
- 「お探しのページは見つかりません」
例: https://www.titech.ac.jp/moo/
- サーバのデータがうまく解釈できない。
インターネット上の有名なサイトが止まっている場合は、
上のような
ping
コマンドを使って検査する以外にも、
以下のような「障害チェック」サイトを使って調べることもできる。
5. 本日のまとめ・小課題
- コンピュータ上のデータは、すべて 0 と 1 で表される。
- データ圧縮技術のおかげで、通信料金が節約できる。
- インターネットはややこしい。
- 通信料を気にしている友人にメールを送ることを考える。
100ページの文章 (文字のみ) を送るのと、
10枚の写真を送るのとでは、どちらも標準的な品質を仮定すると、
どちらがより相手の通信料を消費するか。またそれはなぜか答えよ。
- 回答は Quiz 4 に提出せよ。
- 締め切り: 6月15日 (1週間後)
6. クラス共通課題2の説明
クラス共通課題は、全クラス共通の (やや大変な?) 課題です。
7. 次回予告
- 情報セキュリティについて。
- 情報リテラシとは一体何だったのか?
Yusuke Shinyama