12月7日
|
|
井の頭公園西側の夕暮れです。もう、陽は落ちて残照も刻一刻と消えていく聊か寂しい情景です。撮影時刻は16:10。
|
|
|
井の頭公園のベンチの光景です。ベンチに人影はありません。
撮影方向は「井の頭文化園」方向です。小さな屋根がその入り口です。
「井の頭文化園」の中には入らなかったけど、塀越しに見た中の様子、紅葉が進んでいるようでした。
特に目立ったのは銀杏です。閑があれば、今が見ごろです。
|
|
|
我がサイクリングのツールであるアシストチャリです。その先に保育園の子供たちが遊んでました。
無遠慮にカメラを向けたら、保育のおねえさんに手でバツ印をされちゃいました。
この後、「多摩湖自転車道」を西北方向に20分ほど走ったとき、西の方向に、見事な夕焼けをみました。
写真に撮ろうとしましたが、あまり絵になりそうにないマンション風の建物や、その他無粋な人工物に邪魔されて、
チャンスを逃してしまい残念なことでした。夕焼け空って、数分が命だから、儚いものです。
でも、その儚いものが輝く一瞬の煌めき言葉にはできません。慙愧この上ない思いもですが。
|
少し、情報量という話をしましょう。
人間、写真で見ると、その情景の素晴らしさが一瞬にして理解できます。
一方、この素晴らしさを言葉にするには苦労しますが、何とか400字原稿用紙1枚の文章でこの素晴らしさを言葉にしたとします。
それで、情報量をそれぞれ計算すると、文章の場合、字数は400字です。漢字だとして1字が16ビットで表されるとしたら、400X16で6,400ビットとなります。
一方、写真の方は、エックスプローラーやお絵かきソフトなどで調べると、この写真の場合、203,000バイトであることが分かります。
即ち、同じ情景を言葉で表した場合の情報量は6,400ビット、写真では203,000バイトだからビット数に直すと1,624,000ビットで、
後者が前者の254倍の情報量を持っていることが分かります。
だから、写真で見るとその情景の素晴らしさが一瞬にして理解できるのは、情報量の差とも言えるというわけです。
情報というのは斯くの如く極めてドライなもの。無味乾燥の干物のようなものです。
情報そのものは、美しさや寂しさ等の情緒に関する物理的な量があるかと言えば、そんなものは無いのです。
その無味乾燥情報を受け嬉しいとか悲しいとかを感じるのは、受け取る側の感性の問題。
若し、そうでないとして情緒情報が情報として含まれるとしたら、変なことになります。
例えば、雨という情報の中に、悲しいという情報が含まれてるとしたら、雨乞いの祈祷師が失業しちゃうでしょうし、干天の慈雨という言葉が破綻します。
それに、昔のタンゴミュージック「小雨降る道」がロマンティックではなくなるし・・・。
少し追加しましょう。それは、景色という情景をどうやって固定化するかということ。
昔、高校の化学の時間で、「空中窒素固定」という話を聞きました。そのときは、なんで「固定」なんて言葉を使うのだろうと思いました。
でも、よく考えると分かりますよね、窒素は空気中に多量に含まれているが、そのままでは利用できません。それを利用するために空気中から取り出すことを、
「空中窒素固定」、英語で言えば "fixation of atmospheric nitrogen" といいました。
それと同様に、映像という光の塊を固定する、と呼んだわけです。
固定できれば、我々人類が利用できることになる、というわけです。
光の塊を固定する方法としては、アナログ写真では、ある一瞬の光の塊を乾板に焼き付けるという方法を採りました。
最近のデジカメでは、メモリに記録するという方法を採ります。
メモリに何を記録するかと言えば、見えてる情景のある一瞬を静止しているとみなし、しかも静止画の場面を細分して、
その1個1個の位置情報、光情報(光の強さ、カラー情報など)を記録します。
細分のサイズが小さくなれば解像度が高い、と表現します。大きければ解像度が低いといいます。
また、光情報はその細分された1個1個ごとに記録します。その際、色情報の深度は1から数兆程度にも及ぶバリアントを有しています。
その細分された1マス毎のデータが集まって1枚の静止画として記録されるということになります。
その記録されたデータを「ファイル」とよびます。
従って、言えることは、解像度、位置情報、光情報、で1枚の静止画の情報量が決まってくる、ということです。
例えば、100億種類程度のカラーの種類を識別して記録するとすると、4バイト、即ち、32ビットの容量を持った記憶装置が必要です。
また、位置情報としては、縦横方向の座標の値を夫々数万のレベルまで表し得るようにするには、夫々16ビットが必要になります。
何故なら、2の16乗で65,536ですから。
それが1マスについて必要だから、写真全体では、その総マス数を掛けた容量が必要となるというわけです。
普通、我々の佐高八期会HPでの写真画像は、横800ピクセル、縦532ピクセル程度の解像度を用います。
1ピクセルが1マスに当たります。
その場合の総マス数は、800X532=425,000マスとなります。
その1マス毎に、位置情報に4バイト、光情報に4バイト、所要としますと、全体で、425,000マスX8バイト=3,400,000バイトとなり、
ビット数に直しますと、3,400,000バイトX8ビット=27,200,000ビットとなります。
上の記述で、「この写真の場合、203,000バイトだからビット数に直すと1,624,000ビット」と書きましたが、
その差、27,200,000−1,624,000=25,576,000ビットは、JPGという写真圧縮技術の成果でしょう。
因みに、ビットで表現する情報をそのままの形でファイル化した場合の拡張子は"BMP"(bitmapの略)、
その写真をJPEG方式で圧縮した場合に出来るファイルに付く拡張子は"JPG"となります。
"BMP"についてもっと知りたい方は
ここをクリックください。
また、"JPG"についてもっと知りたい方は
ここをクリックください。
以上、ビットという言葉を使ってきましたが、このビットについて説明をします。
ビットは、ほとんどのデジタルコンピュータが扱うデータの最小単位。 英語の binary digit (2進数字)の略であり、2進数の1けたのこと。
だから、1ビットで表し得る事象は「ある」か「なし」かの2つの事象しかありません。
NHKの世論調査などでよく、「賛成」、「反対」、「どちらでもない」、などの事象が結果としてでてきますが、そのような事象を余すところなく表すには、
1ビットでは駄目で2ビットを要します。2ビットのとり得る値は、2ビットが「1と1」、「1と0」、「0と1」、「0と0」の4通り。
だからNHKの世論調査の結果を2ビットでなら余すところなく表現できる、となるわけです。
因みに、1バイト(これはコンピュータの世界で決めた8ビットをひとまとめにした塊を表す造語)がとり得る値は0から255までの256通りです。
また、2バイト、即ち16ビットだと、256X256=65536、即ち、0から65535までの65,536通りです。
だから、横が800ピクセルの場合、横のマス数が800通りあることになりますから、その座標値も、8ビットでは足りません。倍の16ビットでは余りますが、
コンピュータはバイト単位、即ち、8ビット単位を好みますので、16ビットをとります。そうすると、横のマスが65536まで取れることになります。
だが、解像度が上がり、例えば宇宙探査などの場合は、高解像度を要しますので、16ビットでも足りず、おそらく、その倍の倍の倍、でも足りないかも知れません。
興味ある方は、ネットなどで調べれば出てくるでしょう。
宇宙探査で、例えば、金星の画像が、リアルタイムで見れないのは、高解像度で撮影すれば、結果として、画像データの量が膨大になるので、
その伝送に時間がかかるからです。伝送速度は、光速度でされますが、光速以上のスピードはとれないので、仕方ないですね。
これは、奮励努力するとかのレベルの話ではないので、諦める方がいいでしょう。
でも、そんなはずはない!として、光速以上の通信方式を発明したら、ノーベル賞間違いありません。
何故なら、アインシュタインの相対性理論を覆す大発見だからです。
でも、常識を疑うのが物理学の基本なら、やってみてもいいでしょう。でも、魚は居ないのではないかな!
奮励努力の余地があるとしたらそれは研究対象を決めるところでしょう。魚が居そうなところを見つけるのが大事です。
後は釣り糸を垂れるだけ。スーパーカミオカンデにしろ抗生物質の発見にしろ、魚の居そうなところを狙い撃ちして成功しています。
以上、ビットの説明とノーベル賞挑戦時のアドバイスでした。・・・釈迦に説法だったかな!
12月11日
|
|
「都立東村山中央公園」にて写す。山茶花です。
山茶花と椿は似ているが、見分けるのは簡単で、花びらが1枚1枚と時間を掛けて散るのが山茶花なら、 花毎、一度の落ちるのが椿だそうだ。
山茶花より 椿がいいと 独り言
です。撮影時刻は14:00頃。
|
|
|
西武拝島線「八坂駅」と「萩山駅」の中間地点の多摩湖自転車道上にて写す。
中央は自転車用レーン、左側には遊歩道レーンが改修工事中です。
多摩湖自転車道は、多摩湖(村山貯水池)から武蔵野市にある境浄水場まで約10kmのほぼ一直線のサイクリング 道路です。
安全だし、四季折々に素敵な景色が見られますのでサイクリングの楽しみを堪能させてくれる貴重な場所です。
今は紅葉の美しさが見られてそれはそれは素敵です。だが、春、これもいいですよ!
桜咲いて新緑が芽生え、どこからともない花の香りに包まれて走ると、生きててよかったと思えます。
今から楽しみです。
皆さんもトライしてみてください。
撮影時刻は14:00頃。
|
画像認識(コンピュータビジョン)について
以上、画像に関して、解像度だとか、ビットだとか、固定化とか、ファイルとか、話をしてきましたが、このような話は素人でもちょっと想像力を働かせれば、
理解できるレベルの話です。何故なら、以上の話はデータをハンドリング(処理)するレベルの話だから。
でも、それが、画像をコンピュータで自動認識するには、となると、とてつもなく難しくなるのです。
「処理」と「認識」の差です。「処理」は処理が済んだら結果の評価は人間に任せれば済みます。だが、「認識」は処理した結果を評価しないといけません。
そして「評価」には物差しが要ります。上の写真が美しいか醜いか、その物差し、どう決めたらいいでしょう。
ある人はロマンティックだと評価するかもしれませんが、この場所でずっこけたことのある人は二度と見たくないと評価するでしょう。
・・・評価ってとても一筋縄では行かないのです。
本稿の始めの辺りで、「人間、写真で見ると、その情景の素晴らしさが一瞬にして理解できます。」と書きました。
この文章中の「素晴らしさが一瞬にして理解できる」というところが、コンピュータにとっては難問なのです。理解とはデータを処理して評価することですから。
このAI(人工知能)研究分野は、「パターン認識」(Pattern recognition)と呼んでいて、画像・音声などの雑多な情報を含むデータの中から、
意味を持つ対象を選別して取り出す研究分野です。
取扱う情報は、音声、文字、画像、人の顔、指紋、動作、などなど。
画像に関しては、画像認識(コンピュータビジョン)と呼んでいます。
コンピュータビジョン(computer vision)とは大雑把に言って「ロボットの目」を作る研究分野です。
・・・できれば、その核心技術のさわり辺りに触れたいけど、そのようなものは見つかってないようです。
瞬時に多量データを処理・評価する技術ですが。
現状は、既存の技術の延長線上で勝負というところかな。・・・でも、それでは、当分人間の脳の足元にも及ばない辺りで終始することになると思います。