コンピュータサイエンス第一第7週

2019年11月18日 (月)

注意: 本日の内容は試験範囲には含まれません。

先週の復習
コンピュータを原始的に使う
6502エミュレータを使った演習
アセンブリ言語を使ったプログラム
16ビットの値を計算する
コンピュータの内部で実際に起きていること
オペレーティングシステム (OS) とは何か?
まとめ

雑談

ネットで見る地球。

レポートの採点基準

小課題の場合:
1. そもそもPythonで実行できないプログラム: 0点
```
print("Hello, world)
```
```
while i < 10
    i = i + 1
```
2. 一応動くが、間違った結果を表示するプログラム: 3点
3. 正しく動くプログラム: 5点
中課題 (レポート) の場合:
1. レポートとしての体裁が整っていない (PDFでない、名前・題名などが書かれていない) ものは減点。
2. プログラムの各部分について説明していないものは減点。
  このプログラムは授業で説明したものとほとんど同じである。数字を表示してすこしずつ変化させていくことでアニメーションを実現する。以上。
3. 工夫したこと、苦労したことなどが書かれているものは追加点。

アンケートのお願い

第4Qの授業の改善のため、以下のアンケートをお願いします。氏名は書かなくてよいので、好き勝手に書いてください。

授業は学生に対して「公平であった」と言えるか? 言えなければ、改善すべき点を挙げてください。
講師 (あるいは TA) が「怠けていた」と思える場面があれば挙げてください。
学生の出席率を上げるためのアイデアが何かあればお願いします。
その他、意見・コメントがあればどうぞ。

0. 先週の復習

0.1. 前回までのあらすじ

Pythonで自前の関数を定義する方法を学習した。
シーザー暗号と暗号解析について学習した。

これまで Python を使ったプログラミングの練習をしてきたが、本日はもっと初歩的なコンピュータの原理を説明する。

0.2. コンピュータの4大要素

入力装置 … マウス、キーボードなど。
出力装置 … 画面、スピーカなど。
記憶装置 … メモリ、ハードディスクなど。
演算装置 … プログラムの実行をおこなう中心部分。

1. コンピュータを原始的に使う

本日は、コンピュータのもっとも原始的なプログラミング言語である「機械語 (machine language)」でのプログラムを体験する。機械語は Python のような現代的なプログラミング言語とは違い、文字列で書かれていない。機械語プログラムは、基本的には記憶装置上の数値 (命令語) の列によって表現される。これを演算装置が 1つずつ読み込んで動作する。

1.1. 6502 プログラミング入門

ここでは「MOS 6502」という、 1975年に開発された原始的な演算装置 (のエミュレータ) を使ってみる。これはファミコンや Apple II などの初期のパソコンに使われていた。価格は $100 程度で、当時としては破格に安かった。

MOS 6502 は、以下のような機能をもっている:

使える変数は 3つ (A, X, Y) だけ。変数に入れられるのは 8ビットの値 (0〜255) まで。
使えるメモリ (リストの要素) は 65536個に固定されている。各要素には 8ビットの値を入れることができる。
足し算、引き算、メモリ上の値のコピー、条件分岐、繰り返し処理が可能。

実際にはもうひとつ特別な変数 PC (プログラム・カウンタ) がある。これは、次に記憶装置上のどの命令語を読むかの位置を示しており、演算装置は命令を読んでは実行を永久にくりかえす。演算装置の動作を Python 風に書くと、次のようになる: (実際にはこれはプログラムではなく電子回路そのものによって実現されている)

# メモリの内容 (65536要素の配列)
M = [0, 0, 0, 0, 0, ... ]
# PCは現在実行する命令の位置。
PC = 0

# 以下を永久にくり返す。
while True:
    # 現在の命令を調べる。
    c = M[PC]
    if c == 1:
        A = A + 1  # 変数 A に1を足す。
    elif c == 2:
        A = A - 1  # 変数 A から1を引く。
    elif
        ...
    # 次の命令を実行。
    PC = PC + 1

1.2. レジスタとは

演算装置の中では、変数のことをレジスタ (register) とよぶ。 MOS 6502 には以下のようなレジスタが装備されている。

名前	大きさ	機能
PC	16ビット	これから実行する命令のメモリ上の位置。
Aレジスタ	8ビット	計算のために使う。
Xレジスタ	8ビット	メモリ上の位置を指すために使う。(後述)
Yレジスタ	8ビット	(今回は使わない)
Zフラグ	1ビット	計算結果がゼロになったときに 1 になる。(後述)
Cフラグ	1ビット	計算結果が桁あふれしたときに 1 になる。(後述)

2. 6502エミュレータを使った演習

ブラウザで http://visual6502.org/ を開き、"Visual Sim / 6502" の "Advanced" リンクをクリックする。これは本物の 6502 の電子回路の動きをブラウザ上で仮想的に再現するエミュレータである。

赤色の部分 ( ) は、 +5V の電圧がかかっていることを示す。
緑色の部分 ( ) は、 0V の電圧がかかっている (接地) ことを示す。
黄色の部分 ( ) は、中間的な電圧がかかっていることを示す。

演算装置の世界では、なぜか数値は16進数で表されることが多い。 16進数 (Hexadecimal, 通称Hex) とは、 1ケタの文字で 16種類の数を表わせるようにしたものである。通常の10進数の 0〜9 までの数字に加え、アルファベットの a〜f の文字 (大文字・小文字はどちらでもよい) を「数字」として利用している。 16進数を使うと、2進数の4ケタの数値を1文字で表すことができるため、 0 と 1 の羅列を表す短縮記法としてよく使われている。

10進数	2進数	16進数
0	0000	0
1	0001	1
2	0010	2
3	0011	3
4	0100	4
5	0101	5
6	0110	6
7	0111	7
8	1000	8
9	1001	9
10	1010	a / A
11	1011	b / B
12	1100	c / C
13	1101	d / D
14	1110	e / E
15	1111	f / F

2.1. メモリに値を格納する

では最初のプログラムとして、メモリ上のある位置 (演算装置の世界では、番地 (address) と呼ばれる) にある8ビットの数値を格納する処理をやってみる。これは、以下のような数値の羅列で表現される。

0000: A9 01     ; LDA #$01 - Aレジスタに $01 を格納。
0002: 95 10     ; STA $10  - Aレジスタの値をメモリの 16 番地に格納。
0004: 00        ; BRK      - CPUの停止。

これは Python でいえば、以下のような処理に等しい:

A = 1      # LDA #$01
M[16] = A  # STA $10

プログラムは、メモリ上の 16進数が書かれている部分をダブルクリックして直接入力する。ここでは LDA命令、STA命令、BRK命令を使っている。

命令語 (16進)	バイト数	表記	機能
`A9 XX`	2 (命令 1 + 値 1)	`LDA #$XX`	Aレジスタに値 16進数 XX を記録する。
`95 XX`	2 (命令 1 + アドレス 1)	`STA $XX`	Aレジスタの値をメモリの XX 番地に記録する。
`00`	1	`BRK`	制御装置を停止する。

(もっと詳しい命令語と数値の対応表は以下を参照のこと)

2.2. メモリの値を増加させながらループする

次に足し算とおこなう ADC命令とジャンプ命令 JMP を使ってみる。「ジャンプ命令」とは繰り返し処理をおこなうための命令で、これがくると CPU は指定された番地から実行をおこなう。つまり、以前実行した命令にまた戻ることができる。なお、ジャンプ命令がやっていることは、実際には PC レジスタの値を書き換えることだけである。

0000: A9 01
0002: 95 10
0004: 69 02     ; ADC #$02 - Aレジスタに $02 を足す。
0006: 4C 02 00  ; JMP $0002 - $0002番地の命令にジャンプする。

これは、Python でいえば、以下のような処理に(ほぼ)等しい:

A = 1          # LDA #$01
while True:
    M[16] = A  # STA $10
    A = A + 2  # ADC #$02

命令語 (16進)	バイト数	表記	機能
`69 XX`	2 (命令 1 + 値 1)	`ADC #$XX`	Aレジスタの値に 16進数で XX を加える。
`4C PP QQ`	3 (命令 1 + アドレス 2)	`JMP $QQPP`	16進数で QQPP 番地から実行を開始する。番地の上2桁、下2桁が逆になっていることに注意。 (リトルエンディアン)

演習1.

上のプログラム2種類をエミュレータ上で実際に実行せよ。 Aレジスタの値が FF を超えると何が起こるか?

3. アセンブリ言語を使ったプログラム

いちいち命令語の数値を調べるのは面倒くさいので、これからはアセンブリ言語 (assembly language) というプログラムを使う。これは、文字で命令語を入力すると自動的に数値に変換するものである。ここでは別のサイト http://6502asm.com を使う。

3.1. 最初のプログラム (改良版)

LDA #$01
STA $0200

ここでは、$XXXX というのは 16進数の数値であることを表す。さらに、以下のような表記の決まりがある:

#$01 … $01 という値そのもの。
$0200 … $0200 という「メモリ上の番地に入っている」値。

6502asm.com のエミュレータでは、メモリ上の番地 $0200 〜 $05ff の範囲が画面の各ピクセルに対応している。ここに値を格納すると、それが実際に画面に表示される。つまり、ここではメモリへの書き込みが出力装置も兼ねているのである。

3.2. アセンブラを使ったジャンプ命令

アセンブラを使うと、プログラム中の場所にラベルをつけることができ、実際の番地を書くかわりに使うことができる。

    LDA #$01
loop:           ; ラベル "loop" をここに設定。
    STA $0200
    ADC #$02
    JMP loop    ; "loop" の番地にジャンプする。

注意: ラベル自体はただプログラム中の位置を表すもので、実際の命令ではない。

3.3. 差分アドレッシング

差分アドレッシングという機能を使うと、メモリ上の可変の位置のデータを読み書きできる。これは、画面上のある連続した領域を埋めるのに使える。

    LDA #$01
    LDX #$00     ; Xレジスタに $00 を格納。
loop:
    STA $0200,X  ; Aレジスタの値を ($0200+X) の位置に格納。
    ADC #$02
    INX          ; Xレジスタの値を 1だけ増やす。
    JMP loop

以下、Python 相当の処理:

A = 1             # LDA #$01
X = 0             # LDX #$00
while True:
    M[512+X] = A  # STA $0200,X
    A = A + 2     # ADC #$02
    X = X + 1     # INX

命令語	バイト数	機能
`LDX #$XX`	2 (命令 1 + 値 1)	Xレジスタに値 $XX を記録する。
`STA $ZZZZ,X`	3 (命令 1 + アドレス 2)	Aレジスタの値を ($ZZZZ+X) の位置に格納する。 (差分アドレッシング)
`INX`	1	Xレジスタの値を 1だけ増やす。

演習2.

上のプログラムをエミュレータ上で実際に実行せよ。なぜ画面の一部しか更新されないのか?

3.4. 条件分岐

条件分岐とは、「場合によって、違ったことをする」処理のことである。画面をつねに同じ色で塗るのではなくて、「特定の場所に到達したときのみ、色を変える」にはどうするか?

    LDX #$00
loop:
    CPX #$10     ; Xレジスタの値を $10 と比較。
    BEQ on       ; 等しければ、on に分岐する。
    JMP off      ; 等しくなければ、off に分岐する。
on:
    LDA #$01
    JMP put
off:
    LDA #$02
put:
    STA $0200,X
    INX
    JMP loop

Python 相当の処理:

X = 0             # LDX #$00
while True:
    if X == 16:   # CPX #$10, BEQ on
        A = 1     # LDA #$01
    else:
        A = 2     # LDA #$01
    M[512+X] = A  # STA $0200,X
    X = X + 1     # INX

命令語	バイト数	機能
`CPX #$XX`	2 (命令 1 + 値 1)	Xレジスタの値を $XX と比較する。等しければ Zフラグを 1 にする。
`BEQ ラベル`	2 (命令 1 + アドレス 1)	Zフラグが 1 ならば (直前の値が等しければ)、指定されたラベルに分岐する。

6502 では、比較・演算命令 (ADC, CPX, INX など) の結果によって内部のフラグ (flag) が変化する。フラグとは 1ビットの特殊な変数で、ふつう直前の計算によって生じた変化を記憶している。

Z (ゼロ) フラグ … 計算結果がゼロになった場合に 1 になる。そうでない場合は 0 になる。
C (キャリー) フラグ … 計算結果、桁あふれまたは借り入れが発生した場合に 1 になる (たとえば 255 + 1、 0 - 2 など)。そうでない場合は 0 になる。

上のBEQ命令は実際には何も計算してないように見えるが、内部的には 2つの数の引き算をおこなっている。これによって、 2つの数が等しいときに結果が 0 になり、結果として Zフラグが 1 になる。

3.5. 条件分岐その2

上の条件分岐は、以下のようにも書ける:

    LDX #$00
loop:
    LDA #$02
    CPX #$10
    BNE put      ; 等しくなければ、put に分岐する。
    LDA #$01
put:
    STA $0200,X
    INX
    JMP loop

命令語	バイト数	機能
`BNE ラベル`	2 (命令 1 + アドレス 1)	Zフラグが 0 ならば (直前の値が等しくなければ)、指定されたラベルに分岐する。

4. 16ビットの値を計算する

MOS 6502 ではほとんどの計算は 8ビットでしかできないが、工夫することで 16ビットの計算が可能である。じつは "ADC" 命令は与えられた数に加えて C フラグの値も加えるようにできており、これを使って 8ビットの数を 2回に分けて計算する。

CLC        ; Cフラグをクリアする。
LDA $30    ; メモリ$30番地の値を Aレジスタに読み込む。
ADC #$01   ; A = A + 1 + 0
STA $30    ; Aレジスタの値をメモリ $30番地に書き込む。
LDA $31    ; メモリ$31番地の値を Aレジスタに読み込む。
ADC #$00   ; A = A + 0 + C
STA $31    ; Aレジスタの値をメモリ $31番地に書き込む。

命令語	バイト数	機能
`CLC`	1	Cフラグの値を 0 にする。

4.1. 16ビット値を使った画面書き換え

以上のテクニックと以下の「間接差分アドレッシング」を組み合わせると、 256バイト (=8ビット) 以上のメモリ領域にアクセスできる。つまり、画面のより広い領域に描画できるようになる。

命令語	バイト数	機能
`STA ($ZZ,X)`	2 (命令 1 + アドレス 1)	間接差分アドレッシング。メモリ上の ($ZZ+X) 番地に書かれている値を2バイト分 (16ビット分) 読み込む。 ($ZZ+X) 番地の内容 … PP ($ZZ+X+1) 番地の内容 … QQ その値がさす番地 ($QQPP) に A レジスタの値を書き込む。番地の上2桁、下2桁が逆になっていることに注意。 (リトルエンディアン)

    LDA #$00
    STA $30
    LDA #$02
    STA $31
loop:
    LDX #$00
    LDA #$01
    STA ($30,X)  ; A をメモリ ($30+X) 番地に書かれている番地に書き込む。
    ???          ; 16ビットの加算をおこなう
    ...
    JMP loop

演習3.

上のプログラムを完成させ、画面全体を塗りつぶすようにせよ。

5. コンピュータの内部で実際に起きていること

パソコンで、エディタを起動して A のキーを押し、画面上に日本語の「あ」という文字が表示されたとする。このとき、コンピュータの内部では以下のことが起きている。これを Python 風にかくと、以下のようになる: (実際は Python ではなく、機械語で書かれている)

まずキーボード (入力装置) から「A」のキーをあらわす番号 (65) が演算装置に送られ、変数 (記憶装置) に一時的に格納される。
```
keyCode = 65
```

演算装置の中では、キーボードの状態をチェックするプログラムがつねに走りつづけている。このプログラムは現在の入力モードをチェックし、日本語の場合、これは「A」のキー番号を日本語の文字「あ」に変換する。

# 永久に動きつづけている。
while True:
    if keyCode == 65: # Aが押された場合。
        if inputMode == 日本語:
            print("あ")
        elif inputMode == 英語:
            print("A")
    elif keyCode == 73: # Iが押された場合。
        if inputMode == 日本語:
            print("い")
        elif inputMode == 英語:
            print("I")
    ...

print関数の中はどうなっているか? 実際には、画面に文字を表示するには文字コードだけでは不完全である。
- 画面上の座標
- 文字表示に使うフォント
- 文字の色
…などの情報が必要である。さらにエディタの場合、文字を表示する座標は、カーソルの位置によって決まる。これは、ふつうエディタ内の変数に入っているのでこの値を使って表示する。
```
x = 20                # カーソルのX座標
y = 30                # カーソルのY座標
font = "Gothic"       # 表示に使うフォント名
size = 16             # 文字の大きさ
color = "Black"       # 文字の色
background = "White"  # 背景の色
letter = "あ"         # 表示する文字
showOneLetter(x, y, font, size, color, background, letter)
```

では showOneLetter の中はどうなっているか? 画面に表示される「あ」の文字は、実際にはいくつものピクセルで構成されている。ここでは「あ」の輪郭にしたがって、ひとつひとつのピクセルの濃さを計算する。

def showOneLetter(x, y, ...):
    # ピクセルの色 (R,G,B) を計算する。
    if color == "White":
        R = 255
        G = 255
        B = 255
    ...
    # 文字「あ」の形状を多角形で近似する。
    if letter == "あ":
        polygon = [1, 1, 14, 3, 7, 4, ... ]
    # 16×16ピクセルの文字の場合:
    for i in range(16):
        for j in range(16):
            # 輪郭に従って、位置(i,j) のピクセルの濃さを計算する。
            d = calculateDensity(polygon, i, j)
            # ピクセルを表示する。
            drawPixel(x+i, y+j, R*d, G*d, B*d)

エディタは、通常ウィンドウの中に表示されている。実際の画面上の位置は、このウィンドウの座標からの相対的な位置である。また、このウィンドウが他のウインドウの後ろに隠れていないか、隠れているとすれば、表示部分はどこかを計算する。

def drawPixel(x, y, R, G, B):
    x = x + 200   # ウィンドウのX座標を足す
    y = y + 300   # ウィンドウのY座標を足す
    if 10 <= x and x <= 20 and 100 <= y and 200 <= y:
        # 他のウィンドウに隠れていたら何もしない。
        doNothing()
    else:
        # 他のウィンドウに隠れていなければ表示する。
        reallyDrawPixel(x, y, R, G, B)

現在の PC では、複数の画面が接続されていることがあるので、表示するウィンドウの位置にあわせて出力する画面を選ぶ。また、各画面は微妙に色の見え方が異なるので、これを補正する。

def reallyReallyDrawPixel(x, y, R, G, B):
    if x < 1000:
        # 画面1用に色を補正する。
        if R == 255 and G == 255 and B == 255:
            R = 244
            G = 250
            B = 230
        # 画面1に表示。
        reallyReallyDrawPixelScreen1(x, y, R, G, B)
    else:
        # 画面2に表示。
        reallyReallyDrawPixelScreen2(x, y, R, G, B)

最終的に、(w × h) ピクセルの画面は (w × h) 個の要素をもつ配列になっている。記憶装置の一部が出力装置 (画面) と連結されているので、つまりは配列に書き込むことが、画面のピクセルを表示する (色を変える) ことに相当する。

def reallyReallyDrawPixelScreen1(x, y, R, G, B)
    width = 1920         # 画面1の幅
    height = 1080        # 画面1の高さ
    # 現在のピクセルに相当する配列の位置を計算する。
    i = (y*width + x)
    # そのピクセルの色を変える。
    pixel_R[i] = R
    pixel_G[i] = G
    pixel_B[i] = B

以上の処理を各ピクセル、各文字、各ウィンドウ、各アプリの分だけ繰り返す。

この処理はただエディタで「1文字を入力するだけ」の処理である。実際には、絵を動かしたり音を慣らしたり、それらど同時に実行したりといった処理がコンピュータ上では起きている。

実際には、画面やメモリやハードディスク (記憶装置) は、コンピュータにとってはどれもただの巨大な配列でしかない。コンピュータにとっての「入力」とか「表示」とかいった処理は、実際には、記憶装置のある場所から別の場所へプログラムがデータ (0 と 1) をコピーしているだけである。

6. オペレーティングシステム (OS) とは何か?

現在のコンピュータでは、一般人が上で示したようなプログラムを書く必要はない。文字表示などの非常に基本的な部分は、「オペレーティングシステム (OS, 基本ソフトウェア)」として最初からPCと一緒に提供されているためである。ほとんどの人は、このオペレーティングシステムを使ったアプリケーション (応用ソフトウェア) を書く。しかし実際にはこれはコンピュータで動いているソフトウェア全体のごく一部にすぎない。

また、OS は多くの仮想化処理を実現している。画面や記憶装置は、コンピュータにとっては (長さの決まった) 0 と 1 の配列であるので、実際には以下のものは OS があるかのように見せかけている「幻影」である。このような OS の仮想化機能により、現在のパソコンは実際の仕組みを知らなくても「なんとなく」使えるものになっている。しかし実際の中身は非常に複雑なのである。

OS によって作り出されている見せかけの例

アニメーション … 一定時間おきに画像を何度も書き直す (コピーしなおす) 処理。
ファイルとフォルダ … ディスクは実際にはでっかい配列なので、「ファイル」「フォルダ」などというものは本来存在しない。ここでは、ディスク上のどの要素からどの要素までがどのファイルを表すのかを示す印をどこかに書いておくだけである。
ディスクの「空き容量」 … ディスクは実際には物理的な媒体であり、その容量は増えも減りもしない。一般にディスクの「空き容量」といっているのは、単にディスク上の「ファイルがあるとされている範囲」を除いた残りの部分の大きさを示しているだけである。
メールを「送る」 … 物理的に送ったものはなくなるが、メールは送っても自分の手元に残っている。実際には、メールや画像を「送る」というのは、相手のコンピュータに同じデータをコピーしているだけである。
複数アプリの同時並列処理 … 実際には、コンピュータが実行できるのは一度にひとつのプログラムだけである (注: 最近のマルチコアのCPUを除く)。複数のアプリが同時に動いているように見えるのは、OS が各アプリをちょっとずつ (1/100秒程度) 動かしては高速で切り替えているだけである。ようするに「見せかけ」なのだ。

7. まとめ

現代の最新鋭の演算装置でも、基本的にやっていることは変わらない。ただ量が増えているだけである。

	1975年	2018年
レジスタの数	4	40
計算できるビット数	8	64
メモリの容量	65,536	34,359,738,368
1秒間の命令実行数	1,000,000	1,000,000,000
プログラムの大きさ	10,000	10,000,000,000

結局のところ、コンピュータはみな非常に単純な原理で動いている。これを組み合わせて複雑な処理をしているように見せかけているのが、現代のコンピュータシステムなのである。

Yusuke Shinyama

コンピュータサイエンス第一 第7週

雑談

レポートの採点基準

アンケートのお願い

0. 先週の復習

0.1. 前回までのあらすじ

0.2. コンピュータの4大要素

1. コンピュータを原始的に使う

1.1. 6502 プログラミング入門

1.2. レジスタとは

2. 6502エミュレータを使った演習

2.1. メモリに値を格納する

2.2. メモリの値を増加させながらループする

演習1.

3. アセンブリ言語を使ったプログラム

3.1. 最初のプログラム (改良版)

3.2. アセンブラを使ったジャンプ命令

3.3. 差分アドレッシング

演習2.

3.4. 条件分岐

3.5. 条件分岐 その2

4. 16ビットの値を計算する

4.1. 16ビット値を使った画面書き換え

演習3.

5. コンピュータの内部で実際に起きていること

6. オペレーティングシステム (OS) とは何か?

OS によって作り出されている見せかけの例

7. まとめ

コンピュータサイエンス第一第7週

3.5. 条件分岐その2