ディジタル画像概論覚え書き①

 もうすでに覚えて試験を凌いでしまったので、“覚え書き”じゃないような気もするけど、せっかく勉強したんでここに残すものである。

画像のディジタル化
格子状に置かれた標本点における光強度を取り出す。

画素値
量子化後の各画素のデータ。通常は8ビットで0~256のレベルの値をとる。
2値化画像では量子化レベルが2。これが2以上だとグレースケール画像。

擬似輪郭
量子化レベルが不十分な場合発生。

標本化定理
画像上の位置に対して光強度が正弦波状に変化するようなアナログ画像(最大周波数がF)を考えた場合、標本間隔をFの1/2よりも小さくすれば、元の画像を再現することができるという定理。

エイリアシング
標本化間隔が1/2Fよりも大きいと、元の濃淡信号とは異なる偽信号が発生すること。

ベクタ画像
線分(ベクタ)の組み合わせで構成された画像。

ラスタ画像
画素の集合で構成された画像。

フレームバッファ
コンピュータでディジタル画像を画素の集合として記録するメモリ。

スキャンライン
水平方向の画素の線。

二次元座標変換
平行移動や拡大・縮小、回転といった幾何学的変換は全て行列の積で表すことができる。その場合、変換順序を入れ替えると一般には同じ変換にはならない(回転→平行移動と平行移動→回転では結果が変わるということ)。

鏡映
直線に関して対称な位置に移動する。

スキュー
斜めに歪ませる。

二次元アフィン変換
直線は直線に変換され、直線上の距離の比率は保存される特徴がある。
3Dのポリゴンを変換する場合は、頂点のみを変換し、その間を直線で結ぶだけでよい。
逆変換も二次元アフィン変換であり、元の変換行列の逆行列である。

剛体変換
平行移動や回転をどの順序で何回組み合わせても形状を変えない変換のこと。

投影
投影面に写る範囲を表す角度を画角という。
投影面が大きいほど、焦点距離が短いほど、画角は大きい。

広角レンズ
画角が大きく、広い範囲を1枚の画像に写し込める。

望遠レンズ
画角が小さく、遠くからでも対象物を絞り込んで大きく撮れる。

透視投影
三次元図形の各点から視点に向かって投射線を引いて投影図を作る方法。
点(x,y,z)の投影面上の座標(x′,y′)はx′=x/2とy′=y/2の連立方程式。
遠近感があるが平行線が歪んで表示されるため、ものの形の把握には不向き。

平行投影
投射線が平行。
点(x,y,z)の投影面上の座標(x′,y′)はx′=xとy′=yの連立方程式。
遠近感がないので写実的ではないが、ものの形は正確に把握できるので、設計製図やグラフ描画に利用。

ウィンドウ
投影面上の表示範囲を示す長方形。
奥行き方向の投影範囲を与えるふたつの面を、前方クリッピング面、後方クリッピング面という。
また、描かれる範囲であるビューボリュームは、透視投影では4角錐台のかたち、平行投影では長方形の形になる。

射影変換
透視投影は三次元射影変換。
直線は直線に変換されるが、直線上の距離の比は保存されない。
平行投影はすべてアフィン変換。

消点とn点透視
透視投影では三次元方向の平行な直線群が1点に収束する。
投影面が2軸に平行→1点透視図法
投影面が1軸に平行→2点透視図法
どの軸とも平行でない→3点透視図法

平行投影
投射線が投影面に垂直な直投影(三面図やアイソメ図など)と、垂直ではない斜投影に分けられる。

カメラの露出
撮像素子に光を当てること。
露出を決める要素はレンズ絞り、シャッタスピード、撮像素子の感度の3つである。

①レンズ絞り
レンズ絞りとはレンズ内部の円環状の遮蔽板のこと。
光量を調節する役割があり、その度合いはF値で表す。

F値=レンズの焦点距離(mm)/入射瞳径(mm)

F値が大きい(絞りを絞る)ほど、光量は少ない!
F値が√2倍になると光量は1/2倍になる。
開放F値:レンズで設定できる最小のF値。

②シャッタスピード
撮像素子の前にある光を遮る幕であるシャッタが開いている時間。
光量:シャッタスピードが速いほど暗い。
ぶれ:シャッタスピードが速いほど小さい。

モーションブラー
一定時間内に各画素に到達する光量を積分して人工的にCGでぶれを表現すること。

③撮像素子の感度
例えば、ISO感度というものがある。これは電気信号の増幅率を表す尺度で、これが高いほど画像は明るくなりノイズが増える。

焦点距離とピント調節
ガウスのレンズ公式

(1/a)+(1/b)=(1/f)

a=レンズ前方にある物体の距離
b=レンズ後方で結像する距離
f=焦点距離

被写界深度
実質的にピントの合う距離範囲
・焦点距離が短いほど深い
・絞りを絞るほど深い
・被写体まで距離が遠いほど深い
・ピントを合わせた位置より遠方に深く、手前に浅い
・撮像面が小さいほど深い

画像処理

ダイナミックレンジ
明るい部分と暗い部分の明るさの比。現実はこれがとても大きい。

ハーフトーニング
白と黒しか表示できない装置で、白黒の割合を利用して濃淡を表現すること。
以下の3つがある。

①濃度パターン法
原画像の1画素に複数画素からなる白黒パターンを対応させる。
そのため、画素数は増える。

②ディザ法
画像を各4×4画素のブロックに分割し、ブロック内の画素と原画の画素の値を比較し、その大小関係で、その画素を白にするか黒にするか決める。

③誤差拡散法
処理対象画素値fと0と255に二値化した値gとの誤差e(=f―g)を求め、e分をキャンセルして補正するように未処理の周辺画素に分散させ、画像全体の画素を白にするか黒にするか決める。

HDR画像
画素値を整数ではなく、浮動小数点の実数で表現することで、広大なダイナミックレンジに対応できる画像。

LDR画像
通常の8ビット程度の画像。

表色系
色の知覚に基づく顕色系(マンセル表色系など)と、色光の混合量に基づく混色系(XYZ表色系など)に分けられる。

①マンセル表色系
色相、明度、彩度の3つの要素で色を分類する。
ULCS表色系は、色差ができるだけ均等になるように定めたもの(CIE―L*a*b表色系など)。

②RGB表色系
加法混色における三原色に基づく。
C=rR+gG+bBという式において、r、g、b(三刺激値)が負の値をとることを認めると常に成り立つ。

③XYZ表色系
三刺激値がすべて正の値になるよう、仮想的な色XYZを用いる。
三刺激値の比率は、以下の色度座標に表す。
x=X/(X+Y+Z)
y=Y/(X+Y+Z)
z=Z/(X+Y+Z)
このときx+y+z=1の関係があり、色度座標は(x、y)で表現できる(xy色度図)。

④YIQ表色系
輝度成分と二次元の色成分で表現。

カラーモデル
色の信号値に基づく色記述の体系。
行列で表せるが、ブログで書けないので割愛。

画像の圧縮

可逆圧縮方式
画像データの情報を全く失わないので、圧縮率は低いが、完全に復元可能。

非可逆圧縮方式
情報を削減するので、圧縮率は高いが、画質劣化が生じる。

HTMLでの色作成
頭に#をつけたRGB2桁ずつの計6桁の16進数を使い、それぞれ00~FFの256階調の明るさを指定する。
具体的には、白が#FFFFFF、黒が#000000、赤が#FF0000、マゼンダが#FF00FFなど。
色化けを回避するにはWebセーフカラー(RGBそれぞれを00、33、99、cc、ffのいずれかに指定した216色)を使う。

JPEG
写真品質の画像を効率よく圧縮する。
プログレッシブJPEGにすると、ダウンロードの途中で全体がぼんやりと表示され、おおよその内容が早く分かる(昔は上からちょっとずつだったのでじれったかった)。

GIF
256色までしか使えないので、色数の少ないはっきりしたイラストの画像に向く。
インターレースGIFでは使われている色の中の1色を透過色に設定し、透明な領域として扱える(背景色が表示される)。
アニメーションGIFではフレームとして複数の画像を記録し順番に表示していく(パラパラマンガの原理)。

PNG
特許の問題があったGIFに代わる新しい画像形式。
高圧縮率と同時に画質の変化もない。
最大48ビットまでのフルカラーをサポートし、8ビットまたは16ビットのアルファチャンネルにより透過レベルを指定できる。
インターレースのオプションもある。

アニメーションとシミュレーション
アニメーションは動いてないものを動いているように見せる映像技術である。
少しずつ変化する静止画を速い間隔で見せると、人間の目が持つ残像効果や仮現運動(異なる像を見ると動きを知覚する現象)により動いているように見える。
テレビでは毎秒30枚、映画では毎秒24枚の画像を表示している。
アニメーションでは、正確に表示するより、誇張(デフォルメ)して表示した方がうまく見えることがあるが、シミュレーションは正確な数値計算により現象を再現するものであるため、アニメーションのように誇張してはならない。
Calendar
<< April 2024 >>
SunMonTueWedThuFriSat
 123456
78910111213
14151617181920
21222324252627
282930
search this site.
tags
archives
recent comment
recent trackback
others
にほんブログ村 科学ブログへ にほんブログ村 科学ブログ 恐竜へ カウンター
admin
  • 管理者ページ
  • 記事を書く
  • ログアウト