page0031 のバックアップ(No.2)

バックアップ一覧
差分を表示
現在との差分を表示
ソースを表示
page0031 へ行く。
- 1 (2013-04-28 (日) 09:40:28)
- 2 (2013-04-28 (日) 10:26:56)
- 3 (2014-07-25 (金) 10:20:09)
- 4 (2014-07-29 (火) 08:28:16)

フロントエンドバイトコード #0

(by K, 2013.04.28)

↑

はじめに

OSECPUの主要な作者であるところのKは、実はとても小さなプログラムを作るのが得意なプログラマでもあります。
そのためか、たとえばosecpu.exeのver.0.34は10.5KBでできています。普通のプログラマはこれだけの機能をこのサイズに詰め込むことはできません。
さて、osecpu.exeがどんなに小さくできたとしても、OSECPUアプリがムダに大きければ、魅力も半減というものです。そもそもosecpu.exeは自分を小さくするためにすべき仕事をサボっていて、そのしわ寄せがアプリにきてこんなサイズなんだという批判も成立するくらいひどい有様です。
とういうことで、それを解決しようと思います。

↑

状況確認

いろいろな改善を施す前に、まず現状を把握しておきましょう。あまり大きなプログラムで議論しても複雑で理解が困難になるので、app0016を題材にしたいと思います。
```
int32s i:R00, sum:R01, j:R02;
for (j = 1000000; j != 0; j--) {
    sum = 0;
    for (i = 10000; i != 0; i--) {
        sum += i;
    }
}
```
osecpu034の段階では、このプログラムは102バイトになります（実行ファイルは4バイトのシグネチャがつくので106バイト）。102バイトってそんなに悪くないと思うかもしれませんが、これはとんでもなく悪いです。
```
0202000F4240 010000000000 020100000000 020000002710 010000000002
14010100 023F00000001 1500003F 023F00000000
213F003F 043F 030000000002 010000000003 023F00000001 1502023F
023F00000000 213F023F 043F 030000000000 010000000001
```

同じプログラムをx86の32bitで書いたとします。そうすると何バイトになるかというと、19バイトになります。

    MOV     EDX,1000000
label0:
    XOR     EAX,EAX
    MOV     ECX,10000
label1:
    ADD     EAX,ECX
    LOOP    label1
    DEC     EDX
    JNZ     label0

19バイトのダンプはこちらです。

BA40420F00 31C0 B910270000 01C8 E2FC 4A 75F2

102と19を比較すればその差は5.37倍。同じ機能を記述するためにこんなに違うのですから、OSECPUのアプリは機能密度がx86の5倍以上劣る、といえます。・・・これはひどいとうことがお分かりいただけましたか。
言い訳を書いておくと、ver.034までのOSECPUはアプリの機能密度をまともにするための努力を全くしていませんでした。しかし準備はしていました。その気になればいつでも機能密度が上げられるようにと、命令セットには隠れた工夫を入れていたのです。ついにその隠し玉を存分に使う日が来ました！
- ちなみに今のバイトコード体系はまさに内部処理向きに作ってあって、そのおかげで内部処理は書きやすくなり、10.5KBを実現していました。だからしわ寄せのせいでアプリが大きいという指摘は当たっています。
内部処理用のバイトコードは「バックエンドコード」と呼ばれるのが普通で、表に表れるバイトコードは「フロントエンドコード」と呼ばれます。x86でも、私たちが使っているのはフロントエンドコードで、内部ではRISC命令的なバックエンドコードがあるといわれています。しかし表に出てこないのでその仕様はほとんど分かりません。
つまり何が言いたいのかというと、フロントエンドとバックエンドがあるというのは、普通の構成なのです。

↑

現在の案

今考えているフロントエンドコードでapp0016を書くとこうなります。・・・ってアセンブラソースは全く同じです。出てくるバイナリだけが違います。この17バイトのバイナリは内部で一度102バイトの列に戻されて、それでJITコンパイルされることになります。
```
BC2760F4240 210 BC0742170 941B0 BD0 BD0
```
17バイトなら20バイトよりも短いです。1.17倍機能密度が高いといえます。

ちょっと解説しておくと、こういう対応関係になっています。

BC2760F4240 : 0202000F4240 010000000000
210         : 020100000000
BC0742170   : 020000002710 010000000002
941B0       : 14010100
BD0         : 023F00000001 1500003F 023F00000000 213F003F 043F 030000000002 010000000003
BD0         : 023F00000001 1502023F 023F00000000 213F023F 043F 030000000000 010000000001

この変換規則は実はかなり単純なので、これを付与してもosecpu.exeはほとんど増えません・・・というか、これは機種依存しない部分なので、osecpu.exeに含めずに書きます。

↑

こめんと欄

このページにこめんと欄はありません。このページの内容にコメントしたいときはimpressionsにお願いします。