Top
ヘッダー

(2014年8月13日更新) [ 日本語 | English ]

GIS関連 (GIS)






有珠山 / サロベツ泥炭採掘跡
1986年, 2006年の有珠山火口原. ワタスゲ・エゾカンゾウ

[GIS, ソフトウェア, リモートセンシング, 航空写真, 景観]
リモートセンシングとGISは密接に結びき厳密に分ける必要はない

地理情報システム (Geographic Information System, GIS)


歴史
1960年代: 基本構造できるがコンピュータ未普及
1980年代: 欧米で発展
1990年代: 日本導入: ARC/INFO (ESRI社製) - GISスタンダード
1990年代: コンピュータハード・ソフトウェア進歩 → PC処理できる比較的安価なソフトウェア

デジタル地理情報整備
GPS (全地球測位システム global positioning system)
原理: 衛星からの三角測量
精度向上 → 位置情報取得容易
高解像度リモートセンシングデータ入手可能

定義
空間的な位置データを伴う情報をデータベース化し、検索、空間解析、表示などを行なう情報システム
現実世界は、地形、河川、土地利用、行政界等複数カテゴリー要素から成り立ち、地形図でそれらを紙等の媒体に等高線や種々の記号で表現する。GISは個々の要素をコンピュータにデータ構造として格納しデータレイヤとして扱い、種々の解析表示を行なう情報システム
索引

位置情報geometric information: 対象物に関する空間の位置や形状を示す
属性情報attribute information: 性状を示す
→ 論理的に完全にリンク(大きな特徴)

位置に関するデータの抽出、保存、確認、統合、操作、補正、解析を行うために提供されるハードウェア・ソフトウェア両方を含むコンピュータシステム

1. 入出力機能
2. データベース機能
3. 解析機能

[ ベクトルデータ | ラスターデータ ]

データ型 (data format)


(1) 位置情報表現モデル

= 地図入力機能 map information input - 数値化

ベクトルデータ vector form

データは座標と属性によって与えられる
地物を「点」と「線分」と「面(領域)」とで扱い、それぞれに属性データを与え表現 = 各点を座標値として入力 → デジタイザー
地図情報をそのままコンピュータ上に表現する様式であり、正確に地理空間を表すことが可能で、特に、点や線分そして面の相対的位置関係である位相関係 topological relationship を表現できる利点をもつ

面 face: 植生・土地利用vegetation, landuse
線 line: 道路・等高線・河川road, contour, riverline
点 point: 建物・名所building

利点
データ構造が点、線、面を表現
トポロジー的解析可能
面認識、接触関係、接続関係認識可能
データコンパクト
図形データ、属性データ検索更新容易
データ量が比較的小さい
位置情報精度がメッシュサイズに規定されない
位置情報正確
イメージデータより見かけ美しい
欠点
[データ構造]
ベクトル形式ポリゴンの正確な重ね合わせ困難
データ入力にスキャナ、プロッタ等の機器必要
データ構造複雑 → ソフト開発に高度技術必要
[空間解析]
複数ポリゴン図面での統計的比較等、
統計解析手法限定される

ラスターデータ raster form

= イメージデータ image data
空間を規則的グリッドに分割し各グリッドに属性情報を付与し表現
データは2次元配列され、基本的に画像データと同形式で、コンピュータ処理が容易な利点をもつ。しかし、対象物を正確に表現するためにグリッドサイズを小さくするとデータ量が膨大になる
Yes/No type, 階調(1-5, etc.) → スキャナー
利点
データ構造単純
異なるデータ間でもオーバーレイ容易
データ入力に特別機器不要
ソフト開発容易 → 地図化容易
座標系でデータが与えられる
グリッドセル(メッシュ)大きさ一定
統計処理がメッシュ単位で可能
メッシュ相互間比較が可能
空間解析容易
欠点
[メッシュサイズ]
メッシュサイズ過大な場合
関心のある現象が抽出されない
地図表現の正確さを欠く
実質地域との整合性が確保できない
メッシュサイズ過小な場合
データ量膨大になる
[データ構造]
トポロジー的扱いできない

→ 線: ネットワーク分析不可能
→ 面: 領域サイズは評価できない

Mesh1 Larch map 2
図. 1. ラスターデータの基本構造. 図. 2. 航空写真より得られた1963年(左)、1973年(中央)、1990年(右)におけるカラマツ(Larix kaempferi)の立木密度

衛星センサーによる記録はラスター形式である。

(2) ハンドリング機能handling

地図属性(作成年)等の検索機能
分布図・植生図等の作成や地形解析、さらに空間解析等を行なうツール面

植生図等の主題図の作成
デジタル標高モデル digital elevation model (DEM)を用いた傾斜や方位角度、集水域等の抽出

(3) 空間解析機能spatial analysis

ハンドリング機能踏まえ、モデリングやシミュレーション機能(情報システム面)

  1. オーバーレイoverlay解析: 複数要素のレイヤを重ね合わせ相互の関連性や時系列の変化等を解析
    overlay
  2. バッファリング解析buffering: ある地点や河川等の線状地物から、ある一定幅で影響圏等を抽出解析
  3. ネットワーク解析network: 複数経路中、個々のルートにある評価基準で重み付けし目的関数を最大か最小とする経路を探索
  4. 空間分割(ボロノイ分割volonoi polygon): 平面を最寄りの点が同じである地点の集合(ボロノイ図)に分割
  1. 統計解析・シュミレーション: 幾何演算(面積・延長計算) arithmetic calculation GIS → 空間的事象モデリング

→ 生態学への応用: 生物や環境要素の空間的分布パターンと相互関係解明

北大でのArcGIS利用方法

 情報基盤センターの教育情報システム中にあるArcGIS 講座内情報 (PW必要)を参照して申し込めばよい。(→ 変わった!)

WebGIS
インターネットとGISが融合 → GPS搭載携帯型端末用い、現場でデータ閲覧し入力可能

利用者は特別なソフト不要 → インターネット接続環境とブラウザさえあればGIS利用可

[方式]
  • ブラウザのみで動作 Ex. MapXtreme
  • クライアント側にプラグイン必要なもの
双方向の情報交換可能で、登録情報自体が、地理情報データ資源として利活用可
GIS ソフトウェア (GIS software)
水文水質データベース (国土交通省), 気象庁 (Tenki.jp (日本気象協会), 国土情報ウェブマッピングシステム
村山祐司のホームページ, オープンソースを使う、GIS入門, BioEoS: 環境解析学研究室

環境情報システム (environmental information systems)


環境資源情報を正確に素早く抽出するシステム

地質図・地形分布図・土壌図・植生図 → オーバーレイ (McHarg 1969)
↓ コンピュータ技術発達 - コストダウン
→ リモートセンシング + 地理情報システム(GIS)

問題点
  1. スケール
  2. データの質(安易に収集できる情報に偏る傾向)
  3. データ解析 - 手法未開発
環境解析

分布パターン(Turner et al. 1991)
経時的変化
環境要因間相互作用

SFM
= structure from motion
複視点の画像から3Dを再現する手法

複数のカメラ、焦点距離で撮影されたものでも使用できる
画像形式はJPEGでもよい

Bundler: オープンソース

リモートセンシング (remote sensing)


(s.l.) 離れた点から直接触れず対象物性状を計測する技術
(s.s, 一般) プラットフォーム搭載センサを用い、地表からの反射・放射電磁波測定し、地表の物体・性状把握技術

プラットフォーム platform: 人工衛星(e.g., NOAA)や飛行機等のセンサ搭載部
(リモート)センサ (remote) sensor: カメラ・スキャナ等 = 対象物から反射・放射される電磁波情報収集装置(e.g., LANDSAT → MSS, TM = thematic mapper)

仮定(成立しないこともある): 物体の種類・環境条件異なる → 異なる電磁波反射特性

→ 電磁波観測で物体識別や環境条件を把握
Ex. クロロフィル: 波長450 nm (青)と670 nm (赤)付近の電磁波強く吸収 ↔ 740 nm-1300 nm (近赤外線)を特異的反射。波長毎分光反射率は、種・光合成活性度で異なり、種判別・バイオマス推定可

原理 principles
多重スペクトル走査放射計(マルチスペクトルスキャナ multispectral scanner, MSS): 線走査データを可視光-遠赤外までをバンド分け → 信号を画像収録(= 光学センサ)

センサのデジタル値を較正(calibration)し放射量計算補正 + グランドトゥルース
→ 実際の物理量へ変換
Ex. 植生活性度、バイオマス、LAI、プランクトン量、土壌有機物量、土壌水分量、地表面温度
→ 地球規模の陸圏・気圏・水圏の環境情報収集やモニタリング、海域の水温や植物プランクトン濃度推定、陸域土地被覆解析や植生解析等、多分野に利用

グランドトゥルース ground truth: 地上実測値 → 教師付き分類 → 教師無し分類
地上基準点 (ground control point, GCP): 空中写真を用い図化やデジタルオルソ作成するため、地上の測地座標や高さを求める際に使われる既知点(地上基準点)

人工衛星リモートセンシング

利点: 広域データ瞬時把握 + デジタルデータ → 解析が容易・迅速

1972: 地球観測衛星 LANDSAT (当時ERTS) (米)打上成功 → 衛星リモセン普及
LANDSAT: ほぼ地球全域観測資源探査衛星。鉱物・森林・農作物・土壌・水・大気等の資源所在と変化把握目的

RBV (return beam vidicon)撮像管による高解像度画像とMSS4-7画像取得

センサ技術進歩: 空間分解能 resolution (地上解像度)向上や取得可能波長域改善 Ex. 合成開口レーダ
レーダradar (= radio detection and ranging): 対象物からの電波反射測定 → 対象物探知 + 位置検知

センサー特性
観測技術進歩に伴い空間分解能向上、観測波長域増大、時間分解能向上 → 地上データとの検証に関する研究進む → 解析困難だった生態現象や環境条件計測可能 → 画像特性

パンクロマティック panchromatic 画像: シングルバンド/モノクロ画像
マルチスペクトル multispectral 画像: 2つ以上のバンドでデータ記録画像

熱映像 thermal image: 対象物熱的状態(地球表面対象は8-14 μm遠赤外線)を白黒映像で表す。気象衛星の雲分布や海面温度分布観測、航空機からの温排水等、海面温度の観測や、火山や地熱温度分布観測に利用
放射波: 地表から自然に出てくる波 - 多衛星センサーが利用
反射波: ある波長を地表に照射し受け取る波
合成開口レーダ (synthetic aperture radar, SAR): マイクロ波地表照射 → 反射波受信

原理 反射波の振幅と位相を観測 (↔ 一般レーダ: 反射波強度のみを測定)

  1. ポラリメトリ polarmetry: 送信-受信偏波(垂直V, 水平H)を組合わせ、HH, VV, HV, VH等としてプラットホームから出したマイクロ波反射に伴う位相変化を利用した計測方法
  2. SARインターフェロメトリ SAR interferometry: 取得SARデータの伝播経路差による位相変化から生じる

SAR画像上の干渉縞より、地表面の変化や標高等を計測する方法

同一地域を時間を変え観測 → 地表面変化計測
同一地域を異なる方向から観測(直線上を移動しつつ1秒間に1000回以上のパルス状電波を地上発射し地表面からの反射波を受信) → 標高計測 通常カメラ観測と異なり簡単に画像得られない → 画像化に計算機データ処理必要

→ 小型アンテナの開口面を多数並べ大きなアンテナを使用時と同じ効果を得る
→ 開口面を合成したレーダーが名称語源
能動型電波センサー: 地表面物性や起伏、凸凹、傾斜等を観測
全天候型センサー: 昼夜別や、雲・雨等天候に殆んど影響されない

宇宙からの合成開口レーダ観測は、1978年米国海洋観測衛星SEASATで始まり、日本の地球資源衛星1号(JERS-1)や、ヨーロッパ宇宙機関ERS-1、ERS-2、カナダRADARSAT衛星等で行われる。日本では、通信総合研究所(CRL)や国土地理院等が、航空機搭載合成開口レーダ観測を行っている

SAR
短波長電波 = 物質表面で反射しやすい
長波長電波 = 物質内部にある程度入り込む

対象物: 波長 → 電波
_____ > 1/2 → 透過せず反射
_____ < 1/4 → 透過
_____ ≈ 1/2 → 反射と透過の両方発生
Ex. 森林
バンド: 波長 (cm) → パターン
L ___ 15-30 → 葉を透過し幹や地表で反射
X ___ 2.4-3.75 → 葉で反射
C ___ 3.75-75 → 葉・枝で反射 + 条件により幹・地表で反射

→ Lバンド: 熱帯林、北方林等植生分布特定 → 植生変化(Ex. 森林伐採・火災)へ応用
→ C, Xバンド: 葉・枝による反射強度差により更に農地、草地を含む植生分類への応用
SAR森林、地質、防災、農業、雪氷、海洋、惑星探査と多分野で利用
目的にあわせた波長のSARを航空機や人工衛星に搭載し、地球全体観測を行っている
波長23.5 cmのLバンドSAR搭載のJERS-1は、波長特性から資源探査に有効(運用1998.10終了)。運用開始から約6年間の取得データは、現在も多研究分野や実利用分野に利用される

ハイパースペクトル・センサ: 数十から数百の観測波長帯をもつ

今までのセンサでとらえられなかった詳細な解析が可能になるはず

remote sensing
リモートセンシングによるデータ収集

人工衛星 (satellite)


静止衛星 geostationary satellite
赤道上で地球自転角速度と同じ角速度・向きで地球を回る = 地上からは静止

Ex. ひまわり: 高さ35800 km、直下点を中心とする半径約6000kmの範囲の雲観測

極軌道気象衛星 Ex. NOAA(米), METEOR(旧ソ): 極地方 → 静止衛星から見えない

緯度80°上 → 軌道両側±1500 km幅を12時間間隔で観測(極点カバー)

静止軌道衛星 geosynchronous orbiter, geosynchronous satellite
静止気象衛星GSM
極軌道衛星polar orbit satellite, polar orbiter, POES
可視赤外線観測衛星 TIROS
→ 主な地球観測・気象衛星の光学センサ等性能の比較

宇宙航空研究開発機構 (JAXA)

元宇宙開発事業団(かつ元NASDA)所有の地球観測衛星データ (Table参)
Satellite: Remote sensor
JERS-1: SAR, OPS
Landsat: TM, MSS
SPT: HRV
MOS-1, MOS-1b: MESSR, VTIR, MSR
ERS-1: AMI/SAR mode
ADEOS (Advanced Earth Observation Satellite, 1996 一号機)
ADEOS II (みどりII): AMSR, GLI
2002 環境観測技術衛星 → 積雪・土壌水分・海氷分布・水蒸気・降水量・海面温度・海上風・クロロフィル分布(AMSR, Advanced Microwave Scanning Radiometer: 自然放射微弱マイクロ波をマルチバンド受信し、昼夜別なく、雲有無によらず観測可能センサ)
改良型AMSR-EもNASA衛星Aquaに搭載され2002.5に打上げ
WINDS きずな: 超高速インターネット衛星。2008年2月3日17:55打上。静止衛星軌道。軌道高度36000 km。軌道傾斜角0度。軌道周期24時間
GOSAT, いぶき: 温室効果ガスの濃度を観測し大気の異常を監視する。2009年1月23日12:54打上。太陽同期準回帰軌道。軌道高度667 km。軌道傾斜角98°, 軌道周期1時間38分
ALOS, だいち: PRISM (2.5 m, 可視光), AVNIR-2 (10 m, 可視光-近赤外光), 反射波測定合成開口レーダー (PALSAR)
ALOS-2, だいち2号 (陸域観測技術衛星): 昼夜、天候を問わず広域かつ詳細に災害を観測 2014年5月24日12:51打上。太陽同期準回帰軌道。軌道高度628 km。軌道傾斜角98°, 軌道周期1時間37分
GCOM
GCOM-W
GCOM-W1, しずく (気候変動観測衛星): 海や陸の水の状態を観測し台風や集中豪雨を監視 2012年5月18日01:39打上、太陽同期準回帰軌道、軌道高度700 km、軌道傾斜角98度、軌道周期1時間38分

マイクロ波放射計 (AMSR2): 降水量・水蒸気量・風速・水温・土壌水分量・積雪深等の測定を期待

GCOM-C
GCOM-C1 気候変動観測衛星: 塵・雲の分布調べ、火山噴煙や森林火災を観測 2016年予定。太陽同期準回帰軌道。軌道高度798 km。軌道傾斜角99°。軌道周期1時間38分

多波長光学放射計 (SLGI): 380 nm - 12000 nm (解像度250-1000 m) → ・アエロゾル・海色・植生・雪氷等の測定を期待

GPM/DPR 全球降水観測計画/二周波降水レーダ: 雲中を見通して観測し台風の勢いや進路を知る 2014/02/28打上。太陽非同期軌道。軌道高度407 km。軌道傾斜角65度。軌道周期1時間33分 みちびき: 津波ブイと連携し沖合で津波キャッチ 2010/9/11 20:17打上、準天頂軌道、軌道硬度32000-40000 km、軌道傾斜角40°,、軌道周期24時間
価格表 (SED)
ALOS, COSMO-SkyMed, GeoEye-1/IKONOS, Quickbird, RapidEye, SPOT, WorldView-1, WorldView-2, WorldView-3, SkySat

植生指数 (vegetation index)


正規化植生指数 (NDVI)

植物体の光学反射特性利用 → 近赤外と可視光(赤色域)の波長帯使用
→ バイオマス・植生活性度等測定
NOAA衛星AVHRR: NDVIとLAI、光合成有効放射吸収量(absorbed photosynthetically active radiation, APAR)との相互関係に関する研究進み、グローバルな純生産量(NPP)推定行われる。技術はMODISに引き継がれた。AVHRR/MODISデータでは、時間分解能高く多時期データmulti-temporal data取得可能で、季節的変化を利用した植生分類や土地被覆分類できる
季節の異なるNOAA/AVHRRデータ → 植生型・土地被覆分類に有効な波長
  1. 植物の分光特性 - クロロフィル吸収バンド
  1. 森林調査 - 植生判別(森林航測に有効)
    Ex. フィリピン・ピナツポ山噴火による植生被害と変化(Saito et al. 1993)。1991.6.15に起きた噴火前後を比較し植生被覆割合の減少率で表す。噴火直後の7.5時点で減少率90%以上の地域は160,000 ha以上
正規化水指数 normalized difference water index, NDWI

湿原等ではNDVIのみでの植生区分は不十分 → 水考慮

LANDSAT-TM: NDWI = (TM3 - TM5)/(TM3 + TM5)

(McFeeters 1996)

正規化土壌指数 normalized difference soil index, NDSI

LANDSAT-TM: NDSI = (TM5 - TM4)/(TM5 + TM4)

(Rogers 2001)

航空写真 (aerial photograph)


生態学における航空写真の有効性

 航空写真判読は、飛行高度にもよるが、かなりの精度で地表面情報を読み取ることができるリモートセンシング技術(remote sensing, リモセン)である。例えば、駒ケ岳南西斜面では、カラマツが一本、一本がはっきりと読みとれる。これを用いて、複数年の航空写真を重ね合わせることで、カラマツ本数の時間的変化を知ることができる。

 リモセンは、衛星データによるものが主流となりつつあるが、衛星が稼動する以前のデータは航空写真しかなく(もっとも、それより古ければ航空写真もない)、まだまだ使いようでは、さまざまな解析に用いることができる。

Koma








駒ケ岳登山道分岐周辺。この画像
をもとにカラマツ侵入過程を解析
した(Kondo & Tsuyuzaki 1999)

森林航測

空から森林状態を記録し、記録情報を利用し森林の質量情報を得る技術の総称
上空から連続撮影したものを基に分析し、面積、樹種、樹高、材積等を測定する。写真による判定方法は、樹木本数については樹冠(クローネ)を数え、樹種は樹冠の大きさ、形、色等で判断する。樹高は立体写真法の視差測定桿を用いて図る。材積は以上の諸要素を総合判断し求める
空中写真 = 航空写真 + 衛星写真 + 気球写真等

航空写真 → (地図化) → 林業経営資料 + 林相、樹種、地質、土壌等判定、森林資源現況把握等利用

森林GIS = 森林に用いるGIS

航空写真判読

[撮影]
林野庁: 普通角レンズ持つ航測用カメラ → 撮影縮尺1/16000
国土地理院: 広角レンズ持つ航測用カメラ → 撮影縮尺1/10000か1/20000

写真重複度: オーバーラップ60%、サイドラップ30%
フィルム: パンクロマチック(原則)

標定図: 林野庁のは高度3400 mで概ね2 km四方が写る
エアフォームパターン airform pattern: ある高度で撮影した航空写真に明らかに現れる形状配置パターン

地形特徴や位置関係の傾向をよく示す → 航空写真判読で利用
ウォータートラック water track: 鉱物質の影響を受けた水が泥炭中を通った跡の植生タイプ

航空写真では周辺湿地林や泥炭地(muskeg)と明瞭な対比を示す

陸地測量部
日本陸軍参謀本部外局で国内外の地理、地形等の測量・管理等にあたる → 国土地理院の前身の一つ
大戦以前の地図の多くここが撮影 → 駒ヶ岳1929年噴火の写真

2008/11/12現在. 2013/02/04挙動確認

入手方法 (赤坂フォーマット改)

  1. 標定図が欲しい場所の1/50000の地図名を把握する。
    参考: http://watchizu.gsi.go.jp/のウオッちず”の画像をくりっく。
    CD-ROM版数値地図
  2. 日本森林技術協会(旧, 日本林業技術協会)および国土地理院が管轄していたが、林野庁に管轄が一本化され、「空中写真作製の終了及び新たな入手方法について」に基づき取り寄せることとなった。
    もしくは、地図センターHP
    で、みたい区域をクリックし、索引表(索引表の見方 P)で、いつの時期に写真をとっているか確認
  3. 欲しい標定図がきまったら,

    (財)日本地図センター 空中写真部 御中
    〒305-0821
    茨城県つくば市春日3-1-8
    TEL: 029-851-6657
    FAX: 029-852-4532
    e-mail: shashin(at)jmc.or.jp

    に、くだないな と お願いする
    といったかんじです

ドローン (drone, UAV)

2015.12.10 改正航空法: 無人航空機(ドローン・ラジコン機等)の定義及び無人航空機の飛行ルール定める 2016.04.07 小型無人機等飛行禁止法(ドローン規制法)施行

国重要施設(内閣総理大臣官邸等)、外国公館や原子力事業所等の周辺地域上空での飛行禁止

[統計学]

地統計学 (geostatistics)


= 地球統計学 = 空間統計 spatial statistics
→ 空間解析spatial analysis

(Tobler 1972)

地理学の第1原理

全てのものは他のものと関係 → 近いもののほうが遠くのものより強く関係

→ そのようなパターンは外因性 exogenous or induced・内因性 endogenous or inherentプロセスが混合し生じる

空間(R2, R3)中に生起するランダム現象統計解析

Def. 範囲 extent: 解析に用いる(のに適切な)空間範囲 ↔
Def. 解像度(単位) grain: 空間(間)の単位
Def. 異方性 anisotropic: 空間的方向により性質や特性が異なる。等方性でないこと ↔ 等方性

背景: 計測機器発達による解析能力向上、人工衛星観測データ(画像)等の大規模データ蓄積

ランダム現象 + 生起時間 → 時系列
ランダム現象 + 生起位置 → 空間統計

→ モデルの種類
  1. 点パターン point pattern: 空間のランダム点集合(点の位置個数共にランダム)モデル Ex. 森林立木位置
    マーク(付属量) mark: Ex. 立木位置に樹種名等の入力インデックス
  2. ランダム閉集合 random closed st (RACS): ある空間の閉集合の全体が作る空間上の確率分布
    ステレオロジー stereology: 組織平均特性量を、その断面観測値から推定。Ex. 解剖学、鉱山学
    モルフォロジー morphology: 模様(パターン)を集合論的演算で変形(平滑化)し特性量を抜き出す
  3. 空間回帰spatial regression: 確率場(時系列多次元版)に近い。観測値分布は正規分布仮定
    Ex. クリギング(南アフリカ鉱山技師Krige考案): 複数個ボーリングサンプルから採石場全体鉱物含有量推定

データ分類

Def. 定常性(移動不変) stationarity: 与えたn点の相互位置関係は他に移動しても不変 → 空間分析の仮定

強定常性 > 弱定常性
2次定常性
本質的定常性

1. 確率場データ geoStatistical data
観測地点(一般に連続空間上点)固定 – 空間回帰モデルを当てはめデータ

Ex. 測候所降雨記録、観測地点汚染物質濃度、河川流域サンプル地点土壌浸透率(離散データ)

小規模変動: 観測地点距離が近ければ観測値も類似する性質でGeoStatisticalデータで見られる
→ 観測値の空間的変動を観測地点同士の距離関数としてモデリング: 全方向(一方向)バリオグラム推定

2. 格子データ lattice data
(不)規則的配置された領域の集まりに付随する観測値で、一般に「近傍情報」利用可能
確率場データと点パターンデータの中間的位置づけ

Ex. 規則的格子: リモートセンシングデータ(R2規則的格子)、不規則格子: 州内各郡癌発生率

Def. 格子 lattice (数学): 頂点vertexと辺edgeからなる構造

– 格子データ: 各サイト = 頂点、近傍同士 = 辺が辺で結ばれる
近傍同士の結びつきの重みを与えられる

Ex. 共有する州境の長さに比例させた重み

Ex. 距離や共有境界長を元にした近傍定義や最近接距離算出, 空間的自己相関算出検定, 共分散構造に条件付自己回帰(CAR)モデル, 同時自己回帰(SAR)モデル、移動平均モデルを仮定した空間回帰

3. 空間点パターン spatial point patterns
点パターンモデルを当てはめるデータ

ランダム性検証 randomization test → H0: CSR (complete spatial rondomness)

Kernel, Loess, Gaussianモデルによる強度推定
Ripley's K関数を用いた2次定常性検定

Ripley's K-function (Ripley 1981, Fehmi & Bartolome 2001)

2 種の点が離散(集合)する空間スケールを得る
k = (1/λ)·(1/NΣj=1NΣj≠1kij, kij = 0 (jt), 1 (j > t)
λ = N/S, N: 単位面積あたり点数, S: サイズ
L(t) = √(K(t)/π) → 検定: Monte Carlo

空間(的)自己相関分析
オブジェクトの位置と属性を同時に考える → 点パターン分析では不十分
Def. 空間自己相関 spatial autocorrelation, ac (Cliff & Ord 1981, Haining 1990)
  1. ある変量とそれ自体の空間との相関の存在
  2. ある変量の値同士の関係が、それらの間の空間距離もしくは位置の関数である状態
    空間自己相関がある = データが近いデータと独立でない
変量の空間相関強さ → 変量値間関係が空間距離か位置の関数で表せる

存在確認(検定)法 [仮定 m, s一定]
1. 空間的モデリング
2. 多変量回帰・トレンド当てはめによる残差検定

空間内相互作用 → 解決すべき問題
  1. 説明変数: 多重共線性 [Ridge回帰, 主成分回帰]
  2. 誤差項: 空間的自己相関(系列相関) [Error component model], 不等分散 – ゾーン区切(大きさ・集計等)
1. Join統計量 (join count analysis): 空間的自己相関中最も単純

→ [適用に制限] 正方形セルのラスタデータ + 2値属性 binary

geostatistics
N = 45 (正)___N = 104 (負)__N = 80(0)
→ 空間的自己相関

方法: 全隣接(上下左右)セル対のうち白黒対を数える(N)

N↑: 正ac > ランダム分布: E[N] = 75.40 > N↓: 負ac

検定 → H0: 特定傾向存在しない = 白黒はランダム分布

領域内の白(w)黒(b)数、領域縦(c)横(r)セル数

ランダム分布N期待値, E(N) = 2bw(2crcr)/{cr(cr – 1)}

N < E(N) → 正の空間的自己相関 N > E(N) → 負

統計的検定(セル数十分なら検定可能) → 白黒がランダムに割り当てられる場合N

V(N) = bwS1/{4cr(cr – 1)}

+ bw(S02 + 2S0
S1)/{cr(cr – 1)·(cr – 2)·(cr – 3)} – [bwS0/{2cr(cr – 1)}]

~ N(μ, σ) [S0 = 2(2crcr), S1 = 8(8cr – 7c + 7r + 4)]

→ 統計量 z = (|NE(N)| –0.5)/{cr(cr – 1)},

0.5はNが整数値しか取らないことを考慮した調整用の値
z = 十分大 → 同色セル同士が集まると結論できる

Join統計量は、隣接関係を上下左右4方向ではなく、斜めを加え8方向にしても、ほぼ同様に用いられる

[応用(多値属性を持つ場合)] コンビニエンスストアの競合関係

統計的検定 → モンテカルロシミュレーション
問題点:
1) 属性が二値に限定
2) セル全て合同
3) 2セル隣接関係にのみ依存(距離無関係)

geostatistics 隣接行列 neighboring matrix, adjacency matrix: グラフを表現するために用いる行列

頂点vw間の枝の本数を行列の(v, w)成分に割り当てる
単純グラフ → 枝があるとき(v, w) = 1

↔ 枝がないとき(v, w) = 0

有向グラフ → vからwに向かう枝があるときのみ(v, w) = 1

↔ そうでないとき(v, w) = 0

枝に重みがつくグラフ → (v, w) に重みを代入

Ex. 6ノードと 7のエッジから成るグラフとその隣接行列

matrix Def. a) ドロネー三角網
Def. b) 近隣k地点に隣接関係
Def. c) 周辺一定距離 l 以内の地点に隣接関係
Def. d) 隣り合うポリゴンに隣接関係

a) 全体的空間自己相関 global spatial autocorrelation
均質性仮定 + Join統計量 問題点解決
Moran's I = n/A·Σi,jWi, jzizjΣizi2

matrix
I = 0.910 (正)______I = -0.797(負)______I = -0.052(無)
ランダム分布: E(I) = -0.071

Geary's C = (n – 1)/2A·Σi,jWi,j(xixj)2/Σizi2

オブジェクト属性とオブジェクト間近接性が定義された対象ならよく"点-線-面"データに適用可能
n: 領域数, Wi,j: 領域 i - j間荷重 A = Σi,jwi,j, zi, j = xi,jmx
–1 < I < 1 →
+: 空間的に近いオブジェクト同士ほど類似属性を持つ状態

Ex. 近接性Aij及び領域間距離dij: 重心間距離の逆数

最短距離。ネットワーク距離。時間距離

Moran's Iの統計的検定: 各領域に属性値をランダムに割り当てる状態で期待値E(I), 分散V(I)を考える
E(I) = –1/(n – 1)
V(I) = {(n2 – 3n + 3)/S1nS2 + 3S02

- Σi(xm)4/{Σi(xm)2}2·(n(n – 1)S1 – 2nS2 + 6S02)}/{(n – 1)(n – 2)}

IN(E(I), V(I)) → Moran's Iは近似的に正規分布に従う → 統計的検定可能

Moran's I注意点: 近接度を表す変数設定が重要 (df大な分、分析対象に適した変数を選ぶのが難しい)

b) 局所的空間自己相関 local spatial autocorrelation

Local Moran's I

2. 他の空間パターン解析指数

Pielou, Pi
Clark & Evans, Ce
Pollard, Po
Johnson & Zimmer, Jz
Eberhardt, Eb

空間モデル (spatial model)


(Matheron 1963)

バリオグラム (variogram)

空間的相関、データのもつ距離と方向に関する関係を評価
[仮定] 本質的定常性成立
[手順] バリオグラムクラウド → 経験バリオグラム → 理論バリオグラム
0. バリオグラムクラウド variogram cloud, VC
対をなす標本間(ua, ub)の非類似度(γab)を特性値(z(ua), z(ub))を用い距離に対してプロット

γab = (z(ua) – z(ub))2/2
h = uaubγ*(h) = (z(ua + h) – z(ua))2/2
この段階で、傾向性、異常性(不均質性)、多群性を見ることができる

1. 経験バリオグラム empirical variogram
値得られない位置値をクリギング点推定 → 分散構造予測 → 一般化クリギング(トレンド推定)
γ(h) ≡ (1/2|N(h)|)·ΣN(h)(zizj)2Def. 2γ(h) ≡ バリアンス variance
a. Def. セミバリアンス semivariance,

variogram
N(h): 2点間距離がhになるi, jの組の集合,
|N(h)|:N(h)の要素数,
h: 距離・方向情報を持てばベクトル

全方向バリオグラム: 全方向を考慮
一方向バリオグラム(= セミバリオグラム): ある一方向のみ(ライン調査等)を考える

(セミ)バリオグラム (semi-)variogram: (セミ)バリアンスをプロット – 混同されるが、通常バリオグラムと呼ぶ
バリオグラムを用い自己相関構造を推定し、これをもとにクリギングによる予測を行う

ナゲット nugget = γ(0): 小スケールの変動、測定誤差
シル sill = limh→∞γ(h): 確率場の分散を表す
レンジ range: (存在すれば)自己相関がなくなる距離

求める際の注意点

hをどう選ぶか
h間隔(ラグ lag)許容範囲
何種類のhに対し計算

→ 求めるルール(Journel & Huijbregts 1978)

N(h) ≥ 30のhに対し行う。γ(h)値に信頼を持てるのはDを2点の最大距離とするとh < D/2 の範囲のみ

一方向バリオグラム directional variogram: 北から時計回りの角度を指定した一方向のみのバリオグラム
b. コバリオグラムcovariogram, C(h) = cov(z(i + h), z(i)), for all i, i + hD
c. コレログラム(自己相関関数) correlogram: ρ(h) = C(h)/C(0) = 1 – γ(h)
バリオグラム頑健推定 (Cressie & Hawkins 1980), 統計量 γ(h)

= {(1/2(h))·ΣN(h)(zizj)1/2}4/(0.457 + 0.494N(h))
omnidirectional variogram

2. 理論バリオグラム
[仮定] 等方向: バリオグラムが距離のみの関数

クリギング kriging

既知部分, U = {u1, u2, …, un}

Z(U) = {Z(u1), Z(u2), …, Z(un)} → Z*(u)を推定

単純クリギング simple kriging, SK
特性値とその平均からZ*(u)を推定 → OK, UK, CKはSKの改良版

理論バリオグラムでナゲット効果モデルを取り入れたもの
[Z*SK(u) – m(u)] = Σa=1nλa(SK)(u)[Z(u) – m(u)]

u, ua: 位置, Z(u): 位置uでの確率変数, m(u)

= E(Z(u)): 確率変数Z(u)の位置に依存する期待値

l: 重み(荷重) = Σb=1nλb(SK)C(ub, ua) = C(u, ua), a = 1, 2, …, n
Z*SK(u) = Σa=1nλb(SK)(u)Z(ua) + [1 – Σa=1nλa(u)]m(u)

Σb=1nλb(SK)C(ubua) = C(uua)

通常クリギング ordinary kriging, OK
理論バリオグラムのうち、ナゲット効果モデル以外のモデルを取り入れたもの

Z*OK(u) = Σa=1nλa(OK)(u)Z(ua)
単純クリギングにおいて荷重和を1にしたもの → Σb=1nλb(OK)(u) = 1 Σb=1nλb(OK)(u)C(ubua) + μ(u) = C(uua)

普遍クリギング universal kriging, UK
Z(u) = m(u) + R(u), m(u): 傾向変動(トレンド), R(u): 残差

m(u) = Σk=1Kakfk(u)
z*(UK)(u) = Σb=1nla(UK)(u)Z(ua)

λ = Σb=1nlb(UK)(u)C(ubua) + Σk=0Kμk(u)fk(ua) = CR(uua)

コクリギング co-kriging, CK: 荷重(λ)の取り方でSCK, OCK, UCKが可能

U = {u1, u2, …, un} → Z(U) = {Z(u1), Z(u2), …, Z(un)},
V = {v1, v2, …, vn} → Z(V) = {Z(v1), Z(v2), …, Z(vn)}

U, Vの2特性値から別な点WZ*(w)を推定

Z*(CK)(u) = Σa1=1nλa1(u)Z(ua1) + Σa2=1ωa2(u)Y(va2)

非線形クリギング nonlinear kriging, NK: データを非線形変換解析 → 逆変換(値を元に戻す)

空間モデル (spatial model)

空間操作・空間解析で得た空間パターンに基づき作られる空間現象記述数理的モデル
Ex. 空間回帰モデル・空間選択モデル・点パターン過程・空間拡散過程

空間モデルは、分野毎に開発が行われ一般化遅れた = 体系的説明困難

空間回帰モデル: 点・線・面の各オブジェクト付随属性記述モデル → 理論的(行動)モデルとは言い難い

Ex. 各空間集計単位での作物の単位面積当たり収量を各空間集計単位の気温・標高・雨量等で説明

領域 S{S1, S2, …, Sn},

領域iに与えられる被説明変数yiと説明変数xi1, xi2, …, xip
yixi1, xi2, …, xipで説明 [≡ 一般重回帰モデル]

[問題点] 重回帰モデル: 誤差項の確率分布には(1)独立性、(2)同一性がある
  1. 空間分布データで成立すること稀 → 多くは、隣接する領域の値における誤差は強く相関
  2. 分散共分散行列 → 相関強ければ共分散大
    推定に分散共分散行列必要 → 通常値不明 → 変数ベクトルβと分散共分散行列Cの両方推定必要
1) バリオグラムモデル
  1. 通常回帰モデルを適用し、Y推定値算出 → 残差のバリオグラム作成
  2. 得たバリオグラムに対し適当な理論モデル適用し分散共分散行列C推定(aのバリオグラムは、領域間距離を説明変数(x)、Yの推定値の残差の共分散を被説明変数(y)とするもの)
  3. 推定された分散共分散行列Cを用い、一般最小二乗法によりβを推定し、その残差分布を求める
  4. bcの過程を残差が十分小さくなるまで繰り返しiteration、最終的な結果を採用(収束計算)
2) 空間誤差モデル spatial error model, SEM
誤差分布の分散共分散は,空間的な距離の連続関数として表すことができる(距離のみに依存する)という仮定をおかないモデル
3) 一般化線形モデル generalized linear model
4) Geographically Weighted Regression Model (GER)
回帰式パラメータβが空間上の位置により異なることを明示的に組み込んだモデル
5) Bidimensional Regression Model
変数をベクトル表現 → 関係を線形式記述 (Ex. 地図歪み補正の1方法)

space, u, v: 被説明変数. x, y: 説明変数

空間選択モデル

空間におけるオブジェクト選択行動記述モデル(主に地理学で開発) Ex. 買物先・居住地・観光地・経路選択 h5>1) 重力モデル 領域間の移動交通量や通信量等の記述
Newton重力モデル, yij = G·(Mm/dij2) → 重力モデルから作成
領域 {S1, S2, …, Sn}, 領域iから領域jへの移動数, yij, 領域ijの間の距離, dij

yijdijに明らかに影響を受ける。しかし,iからjへの移動は、他移動候補先1, 2, …, j - 1, j + 1, …, nまでの距離や各領域の持つ移動発生ポテンシャルを考慮し、以下のモデルを考える

yij = αipβjqeγdij

αiは領域iの移動発生地としてのポテンシャル, bjは領域jの移動到着地としてのポテンシャル
p, q, γは負の定数
式を扱いやすくするため、対数変換し誤差項を加え
logyij = plogai + qlogbj + rdij + eij

[モデル推定方法] 各領域ポテンシャルとして人口や産業の生産高等を与え、残りのパラメータp, q, γを重回帰分析で推定する。適用簡単で、良いように思われるが、少なくとも4問題点がある
  1. 推定したデータを発着地それぞれで合計した時に、その和が元のデータの和と必ずしも一致しない
    Σi=1nΣj=1nyij = Σi=1nΣj=1ny^ij とは限らない
  2. 被説明変数yijが,必ずしも整数値になるとは限らない
  3. εijに等分散仮定できない。ポテンシャルの大きい領域間に移動であれば、普通、誤差分散も大きくなる
  4. ポテンシャルとして何らかの変数を予め与えてしまうと、その変数選択がモデル精度に大きく影響
2)-4)は多モデルに共通の問題であり、解決方法は幾つかある
1)は重力モデル固有の問題で重要 → 各領域内の人口は既に与えられているにも関わらず、それ以上(以下)の移動数を予測してしまう可能性がある

→ 解決には、通常Poisson回帰モデルを適用

→ 少なくとも問題点1-3は解決 + p = q = 1とし、その代わりにポテンシャルa1, a2, …, an, b1, b2, …, bnも同時に推定すれば問題点4も解決可能
2) ハフモデル
消費者店舗選択行動モデル – 実際の店舗選択データを用い、店舗選択行動を数理的に記述
消費者{C1, C2, …, Cm}, 店舗{S1, S2, …, Sn}
Sj 魅力度(Ex. 床面積) = Aj,
CiSjを選択する確率 = pij, CiSjの(時間、直線)距離 = dij

pij = (Aj/dijλ)/(Σi=1n(Ak/dikλ))
pij: 店舗の魅力度に比例、店舗までの距離のλ乗に反比例

未知パラメータはλ (多くの場合1.2-2.5)のみで、この値はデータから、収束計算を用い推定
3) ロジットモデル
ハフモデル同様、多くの選択行動記述に用いられるモデル。マーケティング・交通工学が発祥

→ 適用範囲広範 = 統計ソフトパッケージ多(自作の必要性低い)

消費者{C1, C2, …, Cm}, 店舗{S1, S2, …, Sn}
Sjの属性k(床面積, 価格等) = Ajk, CiSjを選択する確率 = pij, CiSjの(時間,直線)距離 = dij
pij = exp(–αdij + ΣknβkAjk)/Σk=1nexp(–αdik + ΣlβlAkl)

α及びβiが未知パラメータで、これらを実データから推測。いずれも距離や店舗面積等の要因が選択行動に与える影響の大きさ(重み付け)を表す

[推定] 最尤法が用いられ、検定に尤度比検定を利用できる

選択肢集合の設定問題
Ex. 全国全店舗を選択肢集合 → 非現実的: 消費者近辺店舗のみを対象としたい(どこまでが「近辺」かという問題がある(研究途上))

[段階的選択行動]

Ex. 買物先 1)「池袋」選択,2) 中で「東武」を選択,3) 中で「レカン」を選択)という行動

選択行動は多段階であり、各段階にロジットモデルを適用する必要が生ずる。しかし、モデルを複雑化し、モデルの推定精度低下(あるいはそれを防ぐためのより多くのデータ取得)を招き解決は容易ではない

4) 点パターン過程 point pattern process (stochastic point process)
点パターン過程: 空間オブジェクト空間データ部分記述モデル

↔ 空間回帰モデル、空間選択モデル: 空間オブジェクト付随属性説明モデル

点オブジェクト: 最も基本的な空間オブジェクト

点パターン過程は、植物や地震、疫病患者等の分布説明に用いられ、生態学で開発されたものが多い
過程 process (≈ 分布): 時空間モデルではなく、ある一時点の分布を説明する背景として時間を取り入れる

a) 二項点過程 binomial point process: 点がランダムに分布という状態を表すモデルの一つ
有界な領域: S, 点の個数: n
点がランダム分布 → Sの部分領域sに含まれる点の個数p(s)が従う確率分布

P(p(s) = x) = (nCx/n!)·(A(s)/A(S))x·(1 – A(s)/A(S))nx,

A(S)はSの面積を表す関数

分布は二項分布 → この点パターン過程を二項点過程と呼ぶ
点分布データ → 二項点過程当てはめ可能

未知パラメータn: 観測データにおける点の個数を推定値として用いる。即ち、モデル推定は自明

b) 一様Poisson過程 homogeneous Poisson process: 有界領域を無限領域に拡張したもの
i) 任意の有界領域sにおける点の個数は平均λA(s)のPoisson分布に従う

どの領域をとってもその中に含まれる点の密度(≡ λ, 強度 intensity)は一定である
P(p(s) = x) = {lA(s)x·eλA(s)}/x!
二項分布でλ固定しSを無限大に拡大 → Poisson分布
一様Poisson過程は、二項点過程において領域Sを無限大に拡大した場合(式の形からも確認できる)

ii) 任意の有界領域sにおける点の分布は互いに独立に二項点過程に従う

どの領域をとってもその中に含まれる点の分布は独立に二項点過程、つまり、一様ランダム分布する

点分布データに対する一様Poisson過程の当てはめは二項点過程の場合ほど自明ではない → 通常、観測データ領域は有界 (↔ 一様Poisson過程の想定している無限領域ではない)。しかし、λ推定値としては、点の個数Mをデータ領域全体の面積Aで割った値を用いることが多い
c) 非一様Poisson過程 (inhomogeneous Poisson process)
一様Poisson過程: λは場所によらず一様(仮定)
→ 仮定緩和しλを場所の関数λ(x) → 強度関数 ≡ λ(x)

i) 任意の有界領域sにおける点の個数は平均xSλ(x)dxのPoisson分布に従う
ii) 任意の有界領域sにおける点の分布は互いに独立にλ(x)で定められる確率分布に従う

モデル推定(強度関数λ(x)推定)の2方法

1) ノンパラメトリック法
2) パラメトリック法

1) ノンパラメトリック法

カーネル法は、本来、点分布からその従う確率分布を推定する方法
点分布カーネル法による点分布可視化: 適当なカーネルを用い確率密度関数推定しl(x)推定値とする

non-parametric
点分布____________________カーネル法による点分布可視化

カーネル傾きパラメータ決定方法: 最小二乗相互評価法least-squares crossvalidation method → データ中1つを除いた時のカーネルを想定し、それが残りの一点をよく説明するようパラメータを定める

2) パラメトリック法

λ(x)が外的要因に定められると考え、想定外的要因関数形を与え、データに合うようパラメータ推定する
Ex. ある植物分布が地中のある物質濃度(分布をh(x)とする)と密接に関係 →
植物分布は、各地点のh(x)と、その周辺の密度に影響される。すると、λ(x) = αexp(–β|xt|)h(t)dt
という関数形が有り得る。このパラメータα, βがデータに適合するよう最尤推定する

d) その他の点過程
  1. Cox過程 Cox process: 非一様Poisson過程における点の強度関数λ(x)が確率的に定まると考えるモデル
  2. Neyman-Scott過程 Neyman-Scott process: クラスタを含む点分布を記述するモデル
  3. 禁止点過程 inhibition point process: 互いにある一定以上の距離を保つような分布
    動植物等で「なわばり」を持つ場合等に適用
  4. 属性付き点過程 marked point process: 点の分布と属性を同時に扱うモデル
ランダム集合モデルrandom set model
点でなくポリゴン変化過程の記述モデル Ex. 細胞成長モデル

時点1での細胞, S1。時点2での細胞, S2, 成長素, Z

  1. S1の中に非一様Poisson分布に従って点が分布
  2. 各点に対し、予め定められた成長素の中の基準点(普通は重心)が一致するよう成長素のコピーを置く
  3. 各成長素の向きをランダムに定める
  4. S1及びそこに置かれた成長素の(点集合としての)和をS2

S2 = S1∪{∪Zi; i ∈ Ω},

Zi: 点iで定められる成長素, Ω: 1で与えられた点集合

ランダム集合モデルは空間モデル中では複雑だが、推定・検定は可能

マルコフ連鎖モデル Markov chain model
土地利用変化等の時間的空間配置変化記述モデル

2時点の土地変化から、土地利用遷移行列Mを計算し、それを用いて時点3以降の土地利用を予測

他モデル

空間伝播モデル
空間競争立地モデル
空間オブジェクト(点以外)分布モデル
ランダム空間分割モデル
ネットワーク成長モデル
フラクタルモデル
オートマトン

フラクタル図形(自己相似図形) (fractal diagram)


(淵上 1987)

自己相似性
基本図形(ジェネレータ)の繰り返しにより形成される
次元 dimension: フラクタル構造は非整数次元を持つ>br /> 空間充填曲線: 一次元曲線であるにもかかわらず無限点において2次元平面を過不足なく埋めつくす曲線
Ex. Peano曲線、シェルピンスキー曲線

→ 1次元とも2次元ともいえる曲線 → 自己相似性を含む → 全ての点で微分可能

相似次元
フラクタル次元を表現するには非整数次元の定義が必要 (Hausdorff & Besikovic 1937)
線分[0, 1]をN等分するとN個の部分に分かれ1/Nの線分がN本集まり全体を構成する。正方形は一辺が1/Nの正方形がN2個集まり全体を構成、同様に立方体はN3個集まり全体を構成し、Nnの指数部分(n)が各図形の次元となる。故に、ある図形が全体を1/Nに縮小した図形P個で構成される時、P = NDD = logP/logN (D: constant) で表わされ、Dを相似次元(フラクタル次元)と呼ぶ
Ex. 1. ペアノ曲線

全体を1/2(N = 2)に縮小した図形4個(P = 4)によって構成される
P = ND, D = 2

Ex. 2. 自然界でのフラクタル(波平 1988): 分岐全般

Ex. 川本支流, 肺・血管構造、星分布, 幹枝

再帰図形 recursive figure

円、三角形等のジェネレータを回転縮小しながら決められた図形上に配置
シェルピンスキーのガスケット
  1. 基準の正三角形を描き、各辺の中点を線で結ぶ
  2. 元の正三角形は中央の逆向き正三角形と、その外側の3つの正立した正三角形に分割される
  3. 外側の正三角形を基準三角形とみなし(1)に戻る

セルオートマトン cellular automata

ある規則に従い自己増殖していく状態を示すもの
fractal
上記の図の場合セル値をAとするとAi(t) = Ai-1(t – 1) + Ai+1(t – 1)と表わせる
格子の1マスをセルとし、1つ1つのセルが周囲の状態によって決定される
fractal fractal fractal
5線分からなるG______コッホ曲線G________ドラゴン曲線G

G: ジェネレーター

セルの動きによって作り出される4パターン(Wolfram 2002)

Type 1. 時間発展と共にセル消滅
Type 2. 定常状態に落ち込み、それ以外の変化はない
Type 3. 小さな形状が生成、消滅を繰り返し一定パターンに落ち着かない
Type 4. 不規則パターンが複雑変化し最終状態を予測できない

コード code: コードを導入しない限り、Type 3以外の図形は生成できない fractal

コード変換: 周囲のセルから算出された値をあるコードで変換し新しいセルの値をすること
fractal
はじめに与えられた値が0であれば、コードに従って0を1に置き換える

複素平面

自己平方フラクタル: 有限空間上にf(z) = z2 + A (z: 複素変数, A: 複素定数)で与えられた図形

発散点のみあるいは発散点と収束点からなる自己相似図形となる

マンデルブロート集合: zn + 1 = fc(zn) → fc(z) = z2 + C

zの初期値を0とした漸化式
n → ∞であってもznが無限大にならないC値 = マンデルブロート集合

ジュリア集合: ニュートン法で方程式を解く → どの解にも収束しない点の集合

コンピュータ上での
発散: ある値以上になった状態
収束: 反復を繰り返しても大きな変化のなくなった状態

空間データマイニング

空間データ → 情報をPCで半自動的検出(PC性能向上 = 発展)

Ex. 空間クラスタリング, 分類, 規則発見

[情報表現]

画像解析 (imagery analysis)


コンピュータグラフィックス (CG, computer graphics)

画像情報のデジタル情報化

ピクセルで画像を描く原理
画像image符号化は、まず画像全体を縦横に枡目分割する。原理は、マスゲームで人文字を描くのと同じで(図2.20)、A君が電話で離れた所にいるB君に模様を黒1色で描かせる様子を示す。A君B君は、同じ目盛の方眼紙を用意する。A君の目盛は透明プラスチック板、B君は普通紙とする

A君とB君の約束
塗り潰しルール

1. A君が電話口で0か1という言葉を順にB君に伝える 2. B君は0が来たら白で1が来たら黒で桝目を塗り潰す

塗る桝目指定ルール(A/D変換)

1. A君が0か1を伝える順番は1行1列目から2列目...と最後の列まで行き、次に2行目に移る。以降、最終行まで繰り返す
2. B君が桝目を塗り潰す順をA君と同じにしておく。

A君の色決めルール

1. 桝目の中心を選び(標本化)、白なら0黒なら1とする(量子化)

graphics
図. アナログ画像のデジタル化

画像情報のデジタル情報化

画像全体情報は、全ピクセル情報を合わせたもの。画像サイズは、縦横方向の枡目数を意味し「200 × 150 px」の様に表わす。このルールで画像を送ると黒1色のため色誤差(量子化誤差)はないが方眼が荒いとB君が作る図は元画像と異なる(標本誤差)。方眼を半分半分と細かくすると元絵に近づき、目には同じ様に見える様になるが、標本化を細かくすれば扱う0, 1量は急激に増え(今の場合2乗)、画質と扱うべき情報量の間にトレードオフがある
カラー画像 (color image)
カラー画像は、「色決めルール」部分が変わる。ただ、色は連続変化なため方眼の中心色を幾つかの色に量子化し使うため量子化誤差が入る。基本色RGB輝度用にNビット用意すると作成可能色は幾つか。N = 2の時の色種類(1 pxあたり2b × 3の6ビット仕様)(1)2ビットで出来るビットパターンは、00 01 10 11の4種類(22)(2)各ビットパターンを、輝度0(なし), 1, 2, 4(最高)と対応(3)ピクセルの色をC(R輝度, G, B)で表すとR輝度種数 × G数 × R数(= 4 × 4 × 4)の64色となる

Ex. 暗赤 = C(1, 0, 0), 明緑 = C(0, 4, 0), 明黄 = C(4, 4, 0), 黒 = C(0, 0, 0)

graphics
図. 画像のデジタル表現
(画像 = ピクセルの集まり)

 RGB輝度を全て同等に扱い、利用者が数値指示し色を作る方法をフルカラー full color (true color)と呼び、本格的画像処理で使われる。フルカラーは、RGB輝度を対等に使うので2N × 2 N × 2Nになる
 文字色の様に数色でよいなら、適当な長さのビット列に色を割当てる方法が使われ、4ビット16色もあるが、この方法で利用者が色を作ることはできない
ビット浪費者としての画像処理
実存色を本格的に使うフルカラーは、1 pxに8 bit × 3(1 byte × 3)かかる。640 × 480 PCで最も荒く1画面に画像を描くと92万byte (740万bit)必要である(3 bt × 640 × 480 = 921600 byte = 7372800 bit)。比較するとa) 1.44 Mbディスクで2画面保存困難。b) JIS漢字コードは1文字2 btで、480 × 640画像は41万文字に対応し400字原稿紙1万枚強。C) ISDN転送速度は64000 b/秒で1画面送信に144秒必要。テレビは30枚分/秒の画像で動画を作るのでISDNでテレビ電話は作れない。画質を落としても見られる写真画像を扱うには色用に16 bit (2バイト)必要となる。画像は莫大なビットを消費する。VOD, video on demandは、見たい時に見たいタイトルの映像情報を提供する機能及びサービスだが、高速回線開発が必要となる
漢字やAlphabet文字も画面には24 × 24といったピクセルパターン表示される点は画像と同じ。ただし、文字処理は、予め個々の文字画像パターンをメモリ記憶させ文字コードだけで処理するため少ないビットで扱える。電報で「1011お願いします」で1011に用意してある文の結婚祝電報が打てるのと同じ
xDSL, x Digital Subscriber Line: 既存通常電話回線を使用し、高速デジタルデータ伝送する技術の総称
利用者と、局の双方で専用モデムを利用し、8 Mbps程度の伝送速度を実現する。従来モデムは、4 KHz以下の周波数帯域を使用するのに対し40 KHz以上の高周波帯を使用することで高速伝送を行う

表. xDSLのタイプ。伝送速度で、「/」区切は、左側が上り(利用者 → 局)、右が下り(局 → 利用者)の速度
タイプ (速度): 伝送距離 → 特徴
ADSL Asymmetric DSL (16K-1M/640K-9M bps): < 5.4 km → 非対称型(上下で速度異なる)
RADSL Rate Adaptive DSL (128K-1M / 1.5-8M bps): < 5.4 km → ADSLとほぼ同じだが伝送速度可変
SDSL Symmetric DSL (160K-2M 5Kmまで): 対称型 (上下で速度同じ)
HDSL High data rate DSL 1.5M, 2M 3.6Kmまで より対線2対(計4本)使用
VDSL Very high data rate DSL (1.6, 3.2, 6.4M/12.9, 25.8, 51.8M): 300 m, 1, 1.5 km → 伝送距離犠牲に高速化

Ex. W3閲覧は、上り方向に流れるデータは数十Byte程度のURL 位に対し、下り方向は、数十-数百KbyteのHTML文書や画像データを流す。下りだけ高速な非対称型と呼ぶ上り下り速度が異なる伝送手段が作られた

画像加工

コンピュータで簡単に画像加工ができる最大の理由は、デジタル画像情報を数値処理している点にある
色の置き換え 「部屋の壁紙を変えたいが、模様は今のままで良いが色に飽きた。カタログ見本は不安なので、いい方法を教えて欲しい」という手紙が来た。この課題を解決せよ。
  1. 部屋をデジタルカメラで写す
  2. 画像をペイント系画像処理ソフトで読込む
  3. 壁紙の適当な部分から元色抽出(ピクセルRGB値を読み取る)
  4. 抽出したRGB値を調整し色を作成
  5. 画像中、元色と一致するRGB値部分を全て調整色で置換(家具等はそのままで壁紙色だけ変えられる)
  6. 気に入った色が見つかるまで3-5を繰り返す
 3-6はコンピュータ自動化でき、ファッションデザインや建築内装等の分野で実用化済
画像合成
古いSF映画では怪獣-背景合成部分分かる → デジタル画像は合成部分がわかりずらい
Ex. 天気予報。テレビカメラをA, B 2台用意し、Aは天気図を、Bは解説者を写すが壁は単色(青が多)にする。2台のカメラで写された映像はA/D変換しコンピュータに送る。コンピュータは、入力されたBのある座標のデジタル画像情報が単色に当たる2進法数値の場合、同座標に当たるAの数値を出力し、単色以外(解説者)の数値の場合はそれを出力する。出力数値はD/A変換しアナログ情報に戻しテレビ電波として発進する。このようにし全座標色データを見ると天気図の前で解説者が説明する画面となる
画像変形
写真をカットガラスごしに見ると変形して見えるのは、(AB)の写像問題となる。図形は点集合で表せ、A(x, y) → B(s, t)対応関係を示す式を作る問題となる。この関数が分かれば、デジカメ写真を変形しディスプレイに映し出せ、連続的に行なうとSF映画の様な画像となる。Ex. テレビコマーシャル
テクスチャ・マッピングtexture mappingは、3次元(3D)グラフィックスで描画するオブジェクト表面に2次元の絵柄(テクスチャ)を貼り付けることをいい、物体表面の質感等を容易に表現できる。レンダリングrenderingは、3Dグラフィックスデータを2D画像に変換表示することで、座標変換や画素色の計算等を大量実行する必要がある
画像情報圧縮
描画ソフト
ペイント系描画ソフト: : 画像を直接扱い絵具で絵を描くようなソフト Ex. MSPaint, Adobe Photopaint ↔ ドロー系

画像はピクセル毎に色情報を作るため情報量膨大となり、画像情報量圧縮(ビット数を減らす技術)が登場した(画像圧縮 compression)。圧縮方法まで含めた画像表現方式に規格がある(Ex. GIF, JPEG, TIFF)。絵画や写真といった画像はアナログ量で、デジタル変換する際に標本化と量子化を行なうが、この段階で既にアナログ情報を圧縮するが、なお画像情報量は莫大なため、デジタルの特徴を利用し更なる圧縮が必要となる

ドロー系描画ソフト: 図形の1種として文字や(小さな)画像を含め配置するソフト Ex. MSDraw, JustSystem花子

幾何学的図形等からなる図では、「どこに、どのような太さと色の線を引く」という情報を符号化し表す方が、一般に1. 画像より少ビット数, 2. 自由な大きさに拡大/縮小, 3. 変更容易、という点で優る。例えば、円を書き保存記録する場合、円中心座標・半径という形で扱うため記録情報容量少ない。図形を幾つかのパラメータで扱う点に着目した画像圧縮技術といえるが、写真や絵画など不定形構成要素から出来た画像は扱えない

画像情報圧縮
静止画像圧縮: 普段目にする風景には、青空に白雲が浮かび、芝生の上にピンクの服を着た人がいるというよう、同色や比較的似た色の広がりでできている。このことが静止画像圧縮のポイントになる
1) 同色の広がり。デジタル情報変換で「赤赤···赤赤」と同2進法値ビット列が続けば、A/D変換時にこの構造を「赤n個」と置き換え、少ビット数に画像情報圧縮できる。元画像色が単純なほど、圧縮率高い
2) 類似色の広がり。自然風景で同色に見える部分も機械測定では異なるが、ヒトは色彩判別能力(分解能)以下の色は同色と判断する。この原理は既に量子化誤差段階で使われるが、基準は実験室で器具を使い濃淡の異なるRGB各単色を測定するものにあたる。自然環境下で人間は機械的に一定分解能で判断していない。多くの人は、2人の人を真横に並べれば5 mmの身長差が分かっても、2 m離れると同じに見える。256段階で量子化した約1670万色デジタル画像を数万色に精度落としても、まず気にならない。この人間認知特性(視覚特性)を利用し、類似色を同1色にまとめ圧縮する。これらをうまく組合わせ画像情報量を小さくする
GIF (Graphic interchange format): 色調を256色以下に落とし(2)、同色情報配列を数値情報化し(1)圧縮し、画像劣化がない特徴 → 複雑な画像の圧縮率は低い
JPG (Joint photograpic experts group): 1667万色以上扱える。人間の輝度変化に鋭いが色調変化に疎い特性を使い色情報を間引く。そのため、完全再現できず(不可逆圧縮)、圧縮率を高めるほど画像劣化する
TIFF: Windowsのメタファイル形式。Windowsの描画命令(GDI命令)をファイルにまとめたもの。プログラムであるため拡大縮小が自由自在なことが特徴。Aldus社とMicrosoft社によって開発されたビットマップファイル用のフォーマット。汎用性が高いので、はがきソフトなどの「素材」で使用されることがある
動画像圧縮: 動画(ムービ)は、音同様にサンプリングするが各サンプルは画像情報(フレーム)でフレーム数は10-20/秒が普通 → 動画情報はビット数が多く圧縮必須
動画圧縮原理はアニメーションと同じで、アニメーションは24枚/秒必要だが全部描くと大変なので、静止背景を1枚描き、変化部分だけセル画を重ね撮影する。同じことをデジタル化画像で行ない圧縮する。映画なら、フィルム(アナログ情報)をデジタル化する。背景に当たるピクセルは同じ2進法数値、変化部分は異なる数値なので、コンピュータ内部で2画面の数値を比較し変化部分だけ取り出す(画像差分情報をとる)。背景に当たる部分と差分とを記録したり伝送したりするのが動画圧縮の基本的考え方で、必要に応じ静止画像圧縮技術も併用する。静止画にせよ動画にせよ、圧縮はプログラムにより素早く自動処理されるが、それが可能なのはデジタル情報だからである
テレビ電話画面中の動き不自然 → コンピュータ処理速度より電話回線伝送速度遅い
Ex. → 受信画像を保存してコンピュータ再生 → 滑らかな動き ↔ 5秒の滑らかな動作データ送信に1分必要
電話は会話リズム優先し、画像は1/12送り音声とのタイミングを取る。CD-ROM画像も、改善されつつあるがCD-ROM装置読取速度が不十分だと装置とコンピュータ本体との伝送速度が遅くテレビほど滑らかではない
情報圧縮
画像・音・文字処理の1研究分野
ダウンロードファイル → 伝送時間節約に圧縮され実行可能プログラムファイルに戻す解凍作業必要
不可逆圧縮: 圧縮前の状態に戻せない圧縮 Ex. 画像圧縮は減色圧縮画像でも見えれば完全復元不要
可逆圧縮: 戻せる圧縮 Ex. 実行プログラム・文章、金銭出納簿等の圧縮は、完全復元しなければ無意味
動画圧縮表現形式:
MPEG (.mgeg .mpe .mpg): 動画の、前と次のコマの相違部分を高速符号化し、データ圧縮、記録
Video for Windows (.avi)
QuickTime (.mov)
FLASH (.swf): Macromedia社Web用コンテンツ作成ツール「FLASH」のムービーファイル

メディア融合

DSP, Digital Signal Processer: 音声や映像などに各種のエフェクトなどの加工をするためのハードウェア
NSP, Native Signal Processer: Intelが発表したDSP機能をソフトウェア機能で代行する構想

75MHz Pentium + PCIチップにTriton + PCIバス実行転送速度100MByte/Sec以上必要
NSPにより安価にDSP機能搭載が可能となる。質を求めるなら、ハードウェアによるDSP機能の搭載がよかったが、現在解消されつつありる。(NSPはMicrosoftの進言で開発中止となった)

 アナログ情報をデジタル情報化する意義は雑音減衰解決に留まらず、情報表現上画期的な出来事である。アナログな「モノ」に付いた音や画像情報がA/D変換でビットパターン表現されればデジタル「記号」情報と同一物に融合し、アナログ量もコンピュータ処理でき、異なったメディア表現された情報が同一環境で取り扱い可能となる。音楽映像化とか、その逆といった新芸術が模索され、書物をスキャナーコピーしコンピュータに読み取らせ、それを音で読ませ目の不自由な人への福祉貢献も考えられる。神経信号はパルス信号なので、画像デジタル処理し視神経に直接つなげば視力障害者の視覚を甦らせる可能性がある。X線画像を立体表示し、回転させ指定場所の音を情報と合成し病気診断する応用もなされている。その一方、簡単に画像合成可能なことは写真証拠能力を低下させ、他人の肖像を画像合成しインターネットに流したり、他人の声を合成し他人のふりをする問題が起こった。情報社会で象徴的な光と影は、画像、音声を含めたデジタル情報表現技術が根底にある

ImageJ

色(rgb)・形態・分布
フッター