Top
ヘッダー

(2016年4月7日更新) [ 日本語 | English ]

情報科学 (information science)






有珠山 / サロベツ泥炭採掘跡
1986年, 2006年の有珠山火口原. ワタスゲ・エゾカンゾウ

[ 情報倫理 ]

情報社会: 多量の情報中から自分に価値ある情報を見つける必要
情報拡大 → 選択肢広げる = 情報を主体的に得る自己責任
情報収集・貯蔵・引出能力が電算機発達で大変化 → 情報取扱い方が大課題
Def. モノobject: 個々の外部に存在する物体や生物

Ex. 動物: モノを感覚器官で受け取り、脳で処理し、行動

「情報」と「データ」は曖昧に使われるが、誤解ない議論のため定義必要 → モノのうち、人間が判断や評価づけする素材や資料をデータ、データに従い判断や行動に役立つものを情報とする

Def. データ data: 判断評価を下す元素材 → 文字列や数値の形で形式的に表現された事象や概念
Def. 情報 information: 特定状況で判断評価できる資料 → データが現す内容で事実に基づく意味を持つ
Ex. 天気予報: 夏の全国高校野球夏大会中 → 兵庫県南部、一日中晴天、最高気温32°C、最低気温25°C

→ 球場弁当売りには、明日用意する弁当数判断に必要な「情報」
↔ 関東の弁当屋さんには「データ」

ある人には情報でも他の人にはデータ → 情報とデータが曖昧となる原因
コンピュータ: 自己価値判断できずネットワーク上のものは全てデータ
→ 人により「情報」となり「データ」となる

「データ」が、状況変化と共に「情報」に変化することもある

情報自体 = 無形 → 外に現れた情報は計量可能 → 価値valueは人が決定

Ex. 戦国武将 「空腹か」より「敵が来たか」「Yes/No」情報が遥かに重要

判断評価 → 知識利用: 情報は「判断材料」というニュアンスがあり、天気図から「気圧配置異常! 冷夏?」と考えると、天気図データを情報とし判断を下す「何か」を持つ → 知識

知識蓄積目的は、問題解決のためであり試験得点を増すためではなく、「辞書の様に詰め込んだ知識」は具体的諸問題への対処力が低く「死んだ知識」と言われる

Def. 知識 knowledge: 情報やデータを体系的にまとめ、判断や思考に利用活用できるように蓄積されたもの
ガーベージ garbage: 記憶装置上の意味をなさないデータ。いわゆるゴミ

GIGO: 信頼できないデータから得た結果は信頼できない

Ex. 必要以上の食物を入力し大量の汚物を出力
Ex. いい加減な情報を入力し誤った判断を出力

索引
情報社会
パーソナルコンピュータ (パソコン personal computer, PC)普及: コンピュータ(組込機器)発明が情報社会の出発点
初期: 単体(スタンドアロン)使用 = データ処理・結果出力 = 科学技術計算・事務処理合理化 → × 情報社会
現在: コンピュータ + 通信ネットワーク digital communication network 技術 → 影響は社会形態変える

コンピュータデータ通信網により、データをリアルタイム取得でき、得る情報量も格段に多くなりました。

→ 情報システム: [基礎技術 = ネットワーク、データベース(DB)] + [応用技術 = 音声認識合成、筆跡認識、曖昧情報推論等] → ヒューマンインタフェース human interface 高度化: より使い易いものに変化

+ マルチメディアデータソフトウェアによりPCは身近となる

情報(化)社会 information society: コンピュータ同士を結ぶデータ通信網により形成された社会(といえる)

情報化加速 → 「情報社会」: 言葉は1960年代末日本でできたが、社会変化をよく表し世界中で使用
新技術普及による社会変化 → 個々人の技術的機構・使用方法習熟だけでなく、用いた行為が人間・社会に及ぼす影響を理解し制御する必要 = 情報化進展が人間関係・企業活動に与える変化を知る

環境問題を考える場合同様、出来事を、流行を追うように見ても問題の本質は捕らえられない

高度情報(化)社会: コンピュータと通信の有機的結合が広く行き渡った社会をこういうこともある

情報処理 = コンピュータ ↔ (協力) ↔ 情報伝送 = 通信機器 → ネットワーク
図1 高度情報社会(情報社会から高度情報社会へ)

DX (デジタルトランスフォーメーション, digital transformation)

情報技術(IT)を浸透させることで人々の生活をより良いものへと変革すること

[画像解析]

情報表現 (information expression)


情報表現をするモノ(メディアmedia)の種類と特徴を、情報科学やコンピュータサイエンスの基礎から問い直す。コンピュータによる問題解決や通信網を通しコミュニケーションでは、目に見えない所で電子的表現された情報が活躍する。情報社会は、人間の頭脳労働を肩代わりするコンピュータと、電気通信ネットワークにより支えられた社会といえる。情報社会を飛び交う多種多様な情報は、コンピュータや電気通信telecommunicationに相応しい形で表現される。この表現は、2つの記号の組合せで全情報を取り扱うため(2進)デジタル信号(= デジタル)と呼ばれる。デジタル信号という言葉の意味を理解し、デジタルによる文章・数値・画像・音等多様な表現と原理を学ぶ。コンピュータ出現以前の社会での情報表現を振り返り、そこに見られる工夫と人間の認知能力との関わりを振り返る。人間とコンピュータが情報をやり取りする時の窓口(マン・マシン・インターフェイス、man-machine-interface)のあり方を考える時の基礎にも関わる

記号の発明とその処理

人間と他の動物の区別基準として、情報を取り扱う頭脳の働き面から人間の特徴を見る。生物行動の殆どは遺伝子情報に支配されるが、俗に言う高等動物ほど誕生後の学習が重要になる。学習は、動物の生活環境に存在する「モノ」との関係を通し行なわれ、その経験が知識として蓄積される。「モノ」は、無機質な物質や動植物、そして人間まであらゆるものを指す。人類は、情報を記録伝達する人工的「モノ」を発明し、情報を記録伝達する「モノ」を“記号symbol”と呼ぶ。記号発明はとりもなおさず「書く」の発明といえる。「書く」は恐らく絵のような具体的表現の「描く」から始まり、やがて象徴化や図形化を経て、言葉を「書く」文字へと進歩を進めた

[情報 → 知識 → 判断]
Ex. 見かけ・匂い → 今まで食べた物の記憶 → 食べるのを止める

図. 情報と判断

記号 → 一情報伝達手段 (記号活用: 言葉による直接的コミュニケーションの限界を超え、複雑な情報伝達可能) → 人類に文明文化もたらす

文明文化: 食料や生活材といった「モノ」自体の生産はもとより「記号」の活用による情報伝達とにより作られる

アルファベット「記号」、またはその単語・文法知らない人は、アルファベット情報は、価値ある内容でも情報活用できない。「記号」が価値を持つには、扱う者に解釈可能な形で表現される必要がある。情報社会では、コンピュータデータ処理し処理結果を情報利用する。コンピュータは電気的に動き、コンピュータ情報処理は情報やデータが電気的に取り扱えるよう表現されねばならない。この表現は、人が慣れ親しんだ表現と随分異なるが、生じる技術上の問題は、文字・数字という「記号」を取り扱う際に経験した点と通じる。情報社会の本質を学ぶことは、何気なく使う文字・数字という「記号」の本質を問い直す
Def. 記号 (s.s.): 「人工的に発明された文字・数字等」 ⇔
(s.l.) 遺伝子、脳内神経伝達物質、羽模様等、情報伝達に関係する全現象を情報研究成果から考えられる。逆に、脳や動物コミュニケーション研究が、新原理コンピュータや情報ネットワーク研究に影響し、情報研究は幅広い学問分野と関わり進められる
実体としての「モノ」と抽象体としての「記号」
Ex. 「古池や 蛙飛び込む 水の音」(芭蕉) → 俳句の価値
1) 価値 = 「表現する言葉(字句)の意味」 → 口伝、手書、活字印刷本どれでも、価値は同じ

意味の情報的価値は、表現媒体(メディア)によらず、何度も複製でき、読めればよい

2) 価値 = 芭蕉直筆の短冊(実体)

言葉の価値 + 文字形、文字配列など視覚的効果(芸術的骨董的価値)
書かれたメディアという実体を含めた実態的価値(Ex. 直筆短冊)は他の実体に置き換えられない 偽物(贋作)は、本物の持つ実体価値の多くを失う → 劣化: 短冊という実体は、作られた瞬間から劣化が始まる宿命を持ち、価値が変化する

絵画・彫刻では、言語芸術と比べ、芸術価値は、形作る「モノ」という実体そのものが価値の正体となる。音楽では、作曲家は作品を楽譜にし、残された音符記号は、演奏家にとり作曲家の産み出した情報としての価値を持つが、聴衆には音楽価値は演奏で演奏が終わると音楽も消える。音楽にとって、楽器は芸術的価値を生み出す「モノ」だが、楽器は音楽そのものでなく、空気振動という「モノの状態」が音楽価値となる
これまでの文明や文化では、「記号」、「モノ」、「モノの状態」の差違が比較的明確であった。しかし、情報革命の進展に伴うデジタル表現された情報社会では、このような見方を超えた新しい表現世界を切り開きつつある
情報表現からみた記号の本質 -文字と数字を振り返る-
コンピュータ内部では、コンピュータ特性に合う電気状態で情報表現されるが、入力データや処理結果出力部分は、普段見慣れた文字数字出力され、内部の文字数値処理形態は意識されない。コンピュータで誤りなく計算・通信するには、内部文字数値表現の理解が必要である。コンピュータで画像や音の処理方法を理解する基礎でもある
Q 身近な物を、それがもつ情報に意味がある、そうでない、どちらともいえないに分類し、結果を人と比較せよ
Q 1) コンピュータ発明につながる計算道具の歴史、2) 主流コンピュータ以外の研究、を調べよ

文字の発明と進化 -表意文字、表音文字-

本来文字は、「モノ」、「モノの状態」、「モノの関係」記録に事柄を1対1対応で作られた。最初の文字は、記録事項をを図式化した象形文字で、名詞のみならず、動詞、形容詞等、言葉になるもの全て図式化が図られた。文明文化が発展し、表現事柄が増え事柄毎に対応し文字を作ると人の記憶能力を越える。問題解決に2つの工夫がされた。1つは、漢字の偏(へん)と旁(つくり)に象徴される複数記号組合わせで文字数を減らす方法である。字形抽象化も進み、形の由来が不明のものや、1文字で複数の意味を持つものも現れたが、「形 = 意味」象形文字の本質的性格は変わらず、表意文字と呼び、漢字は代表である。いま1つの工夫は、アルファベットや平仮名に代表される「文字を要素とし、その組合わせに意味を持たせる」ものである。要素となる文字自体は具体的意味を持たず、口からでる言葉と同じ仕組になり表音文字と呼ぶ

numeric
図. 「牛」の象形文字

表意文字、表音文字の利点と欠点
表意文字は、形で事柄を表現でき、少ない文字数(時に1つ)で豊富な内容を表現できる利点があるが、事柄が増えると多数の文字記号が必要となる。漢字で書物を活字印刷するには、多種多量活字を準備が必要である。これに比べ、表音文字文化圏は少数の活字で済ませられ、タイプライターが発明され日常生活で広く普及した理由である
メモ 当字発生原因は、表意文字の表現力特性(Ex. 中央教育審議会を中教審、大規模小売店舗法を大店法)、即ち、意味推測可能略記可能な点に起因する。表音文字短縮は、新単語を生み出し元の意味が推測不可(Ex. ANK = Alphabetic Numeric and Kana)。ペットボトルPET bottleのPETはpolyethylene terephthalate (化学用語)語源で、動物ペットとは無関係
メモ 昔のコンピュータで「印刷」は、"copy"命令をキーボード入力した。今は、画面上"copy"アイコンiconを押し実施でき、象形文字への先祖返りとも言える。キーボードからc,o,p,yと順に入力しコンピュータに印刷処理させる場合も、コンピュータ内部では"copy"文字列が対応命令コードに変換され、そのコードをコンピュータ頭脳部分(CPU)に送られ処理される
コンピュータの文字利用も同じである。コンピュータでの文字処理には、コンピュータ内部に予め利用する文字と1対1に対応したコードをメモリに準備(記憶)しておく必要がある。コンピュータで漢字を利用するにはアルファベットに比べ膨大なメモリが必要になる。今でこそメモリは、技術革新によって安価になったが、メモリは高価な時代は、コンピュータでの漢字利用は、アルファベットの利用に比べ遅れ、当初はよく使われる一部の文字(日本語ではカタカナ)だけが使われた
数字と記数法、数値表現の発見と進化
数値を表わす記数法も文字同様、記録から始まる。大昔は、取り扱う数値も小さな正整数に過ぎず、記録したい整数値分だけ点や線を書き並べた。しかし、人間が瞬時に個数を識別できる能力は意外に少なく4-5個程度なため、点や線の配置を工夫したり(Ex. トランプ)、5とか10の固まり毎に新しい記号を作る工夫がなされた。この段階での記数法は象形文字同様、単に表わしたい数値と数字を1対1に対応させるものだった (→ 「基本数字」)

numeric
図. 古代数字の例

束の考え方と非位取り記数法
記録すべき整数が大きくなると工夫がなされた。「10個の束」を作り、その束に「10の位用記号」を作り、更にその束が10個集まった「100個の束」に「100の位用記号」を作り...というように各位に対応した「位数字」が発明され、それらを必要な個数だけ書くという方法が取られた
685を「百百百百百百十十十十十十十十五」と書く方法で、具体的個数との対応が見え易いことや加法は容易なことから長い間利用され、1位の「基本数字」とその個数を掛算表現する、今日の漢数字型記数法が発明された。「必要な数字の個数を掛算し簡潔に数値表現する」発想は、「情報圧縮」につながる発想の原点といえる
「百百百百百百十十十十十十十十五」 → 六百八十五
この方法でも扱う数値が大きくなるに従って、新しい「位数字」を追加する必要がある欠点は残る
Q 漢数字では何種類の位数字があるかを調べ、漢数字で表現できる最大の数値を書き表してみよ
数値と数字: コンピュータ内部で、数字は文字とし扱い、計算数値では文字と異なる扱いをする。「数値」と「文字としての数字」の違いを認識せよ
ゼロ(0)の発見と位取り記数法
0(零)のインドでの発見は、他数字に遅れ、0, 1-9の10基本数字を位に応じた位置に置き任意数値を表現する位取り数法発見は遅れた。数字に限らず、文字は本来「存在するモノや事柄に対応し記号を作り記録」するため発明され、殆どの文明圏で「何もない」状態を記録する数字、0がなかった。位取り記数法は、アラビア文化圏を通じヨーロッパにもたらされ金利計算に便利なため商業活動の広がりと共に普及し、筆算技術改良と結びつき近代科学発展に貢献をし、算用数字と呼ばれる。任意数値を、10個の限られた数字配列で表現する位取り記数法の考え方は、アルファベット組合せで任意単語を表わす表音文字といえ、位取り記数法には表音文字と同様の利点欠点が存在する。500003062を一目で「五億三千六十二」と読むのは難しい
記数法と計算
数字発明時の数字機能は記録目的で、計算(筆算)機能は重要視されなかった。計算の工夫は、むしろ計算補助道具(算盤、計算尺等)にあった。電卓や表計算ソフトという計算道具(機)で計算し結果を利用する、道具力を借りて計算し結果を記録するやり方は現代社会の特徴ではない。算用数字の十進位取記数法が普及した最大要因は、簡単に計算できる(筆算)ことといえる。十個の数字で殆どの数を表わせ、自然科学研究で欠かせない記数法になった。算用数字による十進位取り記数法普及は、数値記録の歴史では最近である
メモ 算用数字普及以前は、現在奇妙に見える指を操る計算方法とか、計算結果を予め示した表利用等の計算手順(アルゴリズム)が多数考えられた
メモ 算用数字は字形単純で、位取り記数法では数字追加し数値を書きかえられ、算用数字の手書き十進位取り記数法は偽造がある。アラビア文化圏からヨーロッパに算用数字がもたらされた当時、偽造がはやり「算用数字使用禁止令」が出た。今日でも大事な記録では漢数字で壱、弐、参と書くことがある
Q 1) 漢数字を使い計算、掛算や割算をせよ。2) 計算の歴史を計算手順(アルゴリズム)に着目し調べよ

二進デジタル表現への道 -情報社会を支える情報表現-

コンピュータは、文字や数字、数値、更に音・映像等全データを「電流が流れる・流れない」「磁気がN極かS極か」という単純な電磁気現象の2状態変化を利用し情報処理する。正確には、データが2状態の組合せにより表現・記憶され、データ加工・計算指示(命令)も2つの電磁気現象の組合せで行なわれる。自然は無数の色や音に満ち、普段扱う文字やそれを組合わせた言葉にも多数の種類がある。数値は理論的には無限に存在し、数値修理には複雑な計算を伴うものもあるが、全て単純な2つの電磁気現象で扱える
文字や数字の個数を決めるもの
扱う文字種類は、英文では、26個(大小52)のアルファベットと.や?、!等幾つかの記号で出来ている。算用数字は0を含め10個である。日本語は、何万のもの漢字が使われる。しかし、文章記録や数値処理には、26個や10個である必要はない。今ある記号数を決めたのは、人間の記憶能力や五感に関係し、コンピュータ情報処理では、日常利用する文字個数とは無関係に考えられる
文字記号を増やした世界
アルファベットに27番目としてθ記号を追加し、頻出するthに当てはめると、英単語はより簡潔に表現できる

this → θis, there → θere, three → θree

数でも9の次にABという数字を追加し、12で繰り上がる12進法を位取り基準にした表記できる

8個 9個 10個 11個 12個 13個 → 8個 9個 A個 B個 10個 11個
(十進法)___________________(12進法)

この表現が奇妙に見えるのは慣れの問題で、歴史上では、このような表現は多数あった。英数字の読みには12進法が使われた痕跡が残り、フランス語は十進読みに慣れた日本人から見ると複雑で奇妙である

Ex. 数の読み方
日本語: 十進位取り表記と対応した読み方「じゅう、じゅういち、じゅうに」
英語: 表記は十進位取り、読みは12進法的な「ten, eleven, twelve」
仏語: 70 (soixante - dix ) 日本語で訳せば「60と10」、80 (quatre - vingt) 日本語に訳せば「4かける20」

Q 様々な国の命数法を調べよ。そこからかつてどのような文化交流があったか考えよ
文字記号を減らした世界
Rule [文字・数字数を減らす] → Ex. 英字アルファベットからz省略 → zを含む単語は残りのアルファベット組合わせ(Ex. aa)に置き換える。その新単語が既存単語になければ、それを新単語表現と決める

zoo(動物園) → aaoo, zero(零) → aaero, fuzzy(曖昧) → fuaaaay

実際に26文字より少ないアルファベット系言語も存在する。数値では、0, 1, 2, 3の4字だけを用い4になると繰り上がる4進法にすると、次のような表記が考えられる

2個 3個 4個 5個 6個 → 2個 3個 10個 11個 12個
(十進法)___________(四進法)

単語も数値も、元文字や元数字を減らすと表現は長くなり判断に時間がかかるが、憶える記号数は少なくてすむ。記号を増やすと表現は短く簡潔にできるが、記憶の手間が増える。このように「一方を立てれば他方がたたない」というトレードオフtradeoff関係がコンピュータサイエンスに限らず多分野で見られる
情報表現に必要な最小記号数
情報表現記号数を減らせる下限を記号1から検討する。表現したい文字がN個なら、基本記号を1つ用意し、1個なら1番目の文字、2個 = 2番目 …, N個 = N番目と対応させる。今基本記号を「ピ」という1秒間の音とし、以下2秒間のピ … N秒間のピという長さの異なるピと文字を対応させる

- → 水, -- → 島, --- → 男
音を利用した1つの記号による表現: 漢字。-が1秒のピを表わす
小文字 : a(-)b(--)c(---) -z(26個の-)
大文字 : A(27 個の-)B(29 個の-) -Z(52 個の-)

音を利用した1つの記号による表現: アファベット

アルファベット大小文字は、1つのピ(-)で表せるが、この方法で単語を作ると、大問題が発生し、「---」とあった場合、それが、aaaかabかbaかcかの区別できない
分離記号による解決
個々の文字を他文字と分離する記号を導入し、それを「ポ」とし•で表わす。すると、abは「-•--」と表現できる。英語はアルファベット組合せで単語を作る表音文字のため各単語を「分かち書」し識別する。文章を、「bc a abc」とする。ポ(•)を使えば単語と単語の分離(分かち書)には空白(スペース)に対応する第三記号パ(*)を使えば「--•---*-*-•--•--」となる。しかし、個々の文字の区別区切りはポ(•)を1つ、単語の区切りにはポを2つ並べるから「bc a abb」は「--•---••-••-•--•--」と2記号で表現できる
メモ 英文単語間空白(スペース)は「紙面の地肌」だが、情報表現では空白は単語を区切り文章作成時の分離記号(文字)である。アルファベット系文章も、表音文字のみでなく、空白や終止符(.)、疑問符(?)等は表意文字である
Q アルファベットの-表現と、区切りの規則(•及び••)を用い、This is a penを表現してみよ
Q aに1個の-、bに2個の--と対応させるアルファベット表現方法は、文書作成時の手間や保存、伝達の際に経済効率が悪い。理由を考えよ。(ヒント、出現頻度、モールス信号の工夫)
一定個数の記号の並べ方パターンによる解決
N個の場所を用意し、その場所に-と•のどちらかを置く場合、幾つのパターンが出来るか。場所が1つの時と·の2通り / 場所が2つの時と-•と•-と••の4通り / 場所が3つの時と--•と-•-と-••と•--と•-•と••-と•••の8通り → 一般に、場所がN個あると、-と•を使うパターンは2N通り出来る。次に、N個数の場所に置いた場所-と•を置くことで出来る2N個の異なったパターンに各種のアルファベットや数字、ピリオド(.)やクエスションマーク(?)、+、-、空白等といった特殊記号を対応させ割り当てを考えた時、Nを幾つにすべきか。アルファベット小文字大文字は52個、数字は10個、これに特殊記号を含め、通常の英文は100種類程のパターンが必要となる。100種類程度のパターンに必要となるNの値は、2N > 100となる最小のNの整数解を求めればよく、答えは7で可能なパターン総数は128個である
Q 場所がN個あると、-と•を使ったパターンは2N通り出来ることを証明せよ
Q -- -- -- -をパターン最初、••••••を最後とし、128個全パターンを書き漏れなく、工夫して書け
128パターン個々にアルファベットや空白等の特殊記号を対応させ任意文章を書ける。読み取る時は先頭から7づつ区切り読むので個々のパターンを空白で区切る必要なく、一定個数Nの場所においた-と•でのパターン表現方法は、各文字パターン長(-と•をおく場所の個数)が一定なため固定長表現という。固定長表現された文章中の-と•の総数は、「文字数 × N」で求まる。一方、分離記号を利用した表現方法は、文字により与える記号数が異なるため-と•の総数は「文字数 × N」で求まらない。一連の情報の切れ目を分離記号で行う方法を可変長という。固定長と可変長という様式は、コンピュータ利用の随所で見られる

ビット列と2進数

答が、Yes/Noのような「二者択一」情報は、これ以上分割できない情報最小単位と考えられ、この最小単位をビットbit (b)と呼び、情報科学では情報量を計る最少単位となっている。記号化可能情報は、ビット(b)を使い表現できた。簡潔に書き表すため、1bを2進法 binary systemの1つの桁に対応させ0又は1で表す。こうしておけば、複数ビット組合せも見やすく表せる。雨の降りかたをもう少し細かく表したとする。そのため、2bを使い

振り方 振ってない 小雨 本降り 土砂降り
表現_____00_____01___10____11

のように表せる。ビット数が増えたことと、雨の降り方に関する情報が増えたことが対応している。一般に、ビットがN個あれば、2N通りを表すことができる。実は2進数も、Nビットで「0 – 2N – 1のどれであるか」を表現している
ビット bit: 「2つの内どちらか(異なる状態)」を表わす情報最小単位。「2進法1桁」binary digitの意味です
Q 世の中の情報で、「2つのうちどちらか」、「N通りの場合のうちどれか」で表せるものを考えよ
メモ 情報科学で「情報量」とは「情報に何ビット必要か」という意味で、情報価値の大きさではない。「論論み花花」と「明日は休校」は共に5文字で、情報科学的には「同情報量」ですが、情報の「価値の大きさ」は違う
ビットによるまとめ
  1. 記号化できる任意の情報は、文字や数字によって表現できる
  2. 文字や数字は、幾つかのビットによって表現できる
  3. ビットを使う文字・数字記号表現方法には、可変長と固定長に記号を対応させる方法がある
コンピュータは、ビット表現情報を電磁気現象で操作している機械といえる

コンピュータ内部での情報取り扱い

符号化(コード化): 様々な情報をビット列に対応させ表すこと
符号化規則: 符号化の対応づけ規則

Ex. 「雨が降っていない」を0、「雨が降っている」を1で表わす

文字数値をビットパターンに対応させる際、規則のある形で作ったビットパターンに通し番号(順序数)をつけ、次にその番号順に文字や数字を対応させると、数値処理でき便利なので、コンピュータでは、-と•といった記号ではなく0, 1だけで数値を現せる2進位取り記数法(2進法)を基にビットが扱われる。「電流オン・オフ」、「0 Vと5 V」、「磁石N極, S極」といった2種類の電磁気現象で0, 1を扱う。代表的情報の種類毎に符号化を見る。(ただし、デジタル情報送受信両者が同じ符号化規則を使わないと正確に情報が伝わらない。情報種類毎に標準符号化規則を定め、共通に使うのが一般的)
二進法の原理
十進法位取記数法(十進法)での256の意味は、(256) = 2·102 + 5·101 + 6·100である。一般に、n進法でf桁の数値(abcde)nを巾乗表現は、次のようになる

(abcde)n = a·n4+ b·n3 + c·n2 + d·n1 + e·n0 … (1)

abcdeを仮数、nを基数という。仮数は、n種類の数字で、その内1つは0(ゼロ)でなければならない
Q 2進法の100111011110を10進法で書け。(1)でnを2とし計算 (Q 2526)
Q 10進数の536を二進数にするには、536を2で割った余りを並べていけばできる。これを証明せよ
53 = (26 × 2 + 1↑), 26 = 13 × 2 + 0↑, 13 = 6 × 2 + 1↑, 6 = 3 × 2 + 0↑, 3 = 1 × 2 + 1↑, 1 = 1↑ → (110101) → 2進10進変換
(110101) = 1 × 25 + 1 × 24 + 0 × 23 + 1 × 22+ 0 × 21 + 1 × 20 = 32 + 16 + 0 + 4 + 0 + 1 = 53 (答)(110101) → 2進10進変換
Q 2進法から十進法への変換や、bの十進法から2進法への変換方法は、正確には「十進法を基準とする立場の変換」です。「2進法を基準とする立場」だと変換方法も変わる。「2進法を基準とする立場」での変換方法を考えよ。(ヒント: 計算は十進の「九九」や加減が基準である。「2進法を基準とする立場」だから、「九九」は「二二」に、加減も2進法規則で行う)
A = アルゴリズムが逆転する
二進法と16進法
使う数字の少ない2進数は、十進数に比べ同数値の表現に桁が長くなり、記載には不便で読み間違いも起こり易くなるため、コンピュータや通信関係では二進法そのものではなく、16進法(か8進法)が使われる。16進法が使われるのは、2進法と16進法の変換方法が2進法と十進法の変換に比べ容易だからである。16進法は16個数字が必要で0-9は算用数字を10以上はA-Fを当てる

漢字_________________ _ __ 十 十一 十二 十三.十四.十五
10進__0___1___2___3___4___5__ 6__ 7__ 8__ 9__ 10__11__12__13_ 14_ 15
2進__0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111
16進__0___1___2___3___4___5__ 6__ 7__ 8__ 9___ A__ B__ C__ D__ E__ F
図. 数の相互変換

二進数と16進数との相互変換
Ex. 10011100110
  1. 与えた2進数を下位から4桁ずつの群に分け、最上位群で4つにならなければ0を補う。0100, 1110, 0110
  2. 各群を対応表をもとに16進数字で置き換える。0100 → 4, 1110 → E, 0110 → 5。答4E5
  3. 16進法から二進法に変換するには逆の置き換えをすればよい
→ 16進法と2進法との変換は、10進法と2進法の変換に比べ簡単
メモ ビットによる情報表現の考え方自体には16進法は必ずしも必要ではない
Q 証明せよ(16 = 24): 1·26 + 0·25 + 1·24 + 1·23 + 0·22 + 1·21 + 1·20 = (1·22 + 0·21 + 1·20)·24 + 1·23 + 0·22 + 1·21 + 1·20
パリティ(偶奇性parity)・チェック
電子回路は精度高く作られるが、ビットパターン伝送途中等で特定ビットが1から0に置き換わることがある。処理ビットパターンの正確さを調べるため、本来の文字ビットパターンにチェック用ビットを追加し情報表現に余裕(冗長性)を持たせる方法が生まれた。簡単なのがパリティ・チェック parity checkで、元データ先頭に1bのパリティ・ビットを追加し、データビットパターンにある1の個数が偶数なら0、奇数なら1としデータを扱う。ASCIIでは、「パリティ・ビット1b + 文字コード7b」の計8bを単位とし文字コード伝送し、受信側は、文字部分の1の偶奇を調べパリティ・ビットと一致すれば「誤っていない」、不一致なら「誤っている」と判断する

… 11000011 11000010 … < 信号が来た。> < パリティチェックしよう >
≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈≈
最初の信号、パリティ・ビット1と1000011。OK。ASCIIのCだ。次の信号、パリティ・ビット1と1000010。おかしい! どこか誤っている。知らせよう
図. パリティチェック

パリティ・チェックは、偶数個所の誤りは検出できず、誤った位置は判断できないが、一個所誤る確率をP(実際かなり小)とすると、2個所同時に誤る確率はP2と非常に小さく、簡便なためよく使われる。数値伝送時に、10個おきにそれまでの数値合計を送り誤り検出力を上げる工夫をすると、どの数値が誤って伝送されたか判定できるが、誤り検出力を増やすと取り扱う情報量(ビット数)が増えるトレードオフが起こる

符号化 (半角カタカナ)

初期コンピュータ = 処理スピード遅くメモリ高価 → 日常漢字使用困難

アルファベット同様7bで扱うカタカナと日本語特有の「、」、「。」という記号のみ利用 = 「半角カタカナ」

→ 今日使う全角漢字 = 16b表現: 半角カタカナと全角カタカナは、形は似ても符号化上は別で混在は問題
半角カタカナの表現JIS7ビットコードとJIS8ビットコード
2つの半角カタカナの扱い法がある。1つは、分離記号を使いASCIIの2-7列目ビットパターンに、(41)十六はAと半角チというように、同じビットパターンにアルファベット系とカタカナ系の2つの記号を割り当てる。そしてアルファベット系とカタカナ系の判別は、ASCIIの0列と1列に割り当てた機能コードの(0F)十六のSIと(0E)十六のSOで挟まれたものをカタカナ系、挟まれていないとアルファベット系とする

Ex. ABチツABの表現: (41)等は16進法表現
A__B__7ビットカタカナ始り______7ビットカタカナ終り A__B
41 42__________0F_____41__42______0E_______41 42

もう1つは、固定長の発想で、ASCIIコード表を7bから256パターン作れる8bにする。7ビットASCII最上位にもう1b加え、(01101000)がh、(01101001)がネ(半角)と、付け加えたビットが0の時は、ASCIIと同じ割当てを行い、1の時はカタカナや日本語に特有の、「、」、。、等を表すと約束する
Q JIS7ビットとJIS8ビットのコード表で片仮名等の割り付け方を調べよ

符号化 (全角漢字) JIS第1水準と第2水準の実際

コンピュータ高機能低価格化進むと漢字(日本文字)利用要求が高まったが、漢字符号化は、多数の文字記号があり簡単ではない。日本だけで、歴史的には何万個になるが、大多数は日常生活で殆ど使われず、全漢字を符号化しコンピュータに乗せるのは実用的にも費用面からも得策ではない
この作業には、漢字選別作業と、選別漢字の符号化割り振りという、2つの解決すべき問題がある。漢字には音読み訓読み等複数の読み方を持ち、アルファベットのように単純ではない。このようなことを考え最初に作られたコード体系がJIS第一水準漢字群で、以降も幾つかの漢字が追加されている。漢字追加では、既に社会普及した文字とビット列との対応関係の調整という問題も起こる。従来使われた漢字コードを追加する漢字で利用し、元漢字を別コードに移し変えたりすると、混乱が起こる。日本語処理は16b = 2B (65536ビットパターン)で漢字、(カタ)仮名、アルファベットや各種記号を扱かう。16bで符号化された漢字を7bや8bの半角のアルファベットと区別し全角漢字と呼ぶ。漢字取扱規格で良く使うものに「JISコード(ISO-2022準拠)/シフトJISコード/日本語EUCコード」があり、JIS指定漢字数は6353字である
通信ネットワーク普及に従い漢字をより統一的に取り扱う規格としてISOは書類番号10646で新文字コードを定義し、XeroxとAppleが中心に開発した16bit文字コード体系ユニコード Unicodeという新文字コードが作られた。欧米、日本、中国、韓国を含めた主要文字種が混在できる。今後、普及すると考えられるが2 byte目に1 byteの制御文字と同じコードが入ることや、JISコードと並び順が全く異なる、外字領域少ない等から、反対もあった
Q 各種漢字コードの符号化規則を調べ比較せよ
Q DBや表計算ソフトで漢字人名を「あいうえお順」ソートしても並ばないことがある。漢字コード表を元にその理由を考えよ。正しく「あいうえお」順に並べる方法も考えよ
テキストファイルとバイナリファイル
ワープロメーカーが顧客アンケート調査 → 「黒以外の色や異なる大きさの文字が使えるワープロが欲しい」。メーカーは次のように考えた
メーカーの対応
A社の考え方(まず文字色を増やすことに重点をおき改良)

A社のワープロでの文字の扱い → 色指定に4ビット+ASCII8ビット

「拡張ASCII8ビット文字コード先頭に4ビット追加した12ビットで1文字を扱う。先頭4bで出来るパターンは16種だから16色使える。0000は黒、0101は赤だ」

Ex. 赤色A黒色B 0000 01000001 0101 01000010
_______________________A__________B

B社の考え方(色と大きさ両方を扱う): 「A社と同じ12bでも、色に2b使い4色を、黒00、赤01、青10、黄11。別の2bで、特大、大、標準、小の4サイズを用意。標準サイズ00、特大01といった具合だ。」

B社のワープロでの文字の扱い サイズ2ビット + ASCII+色2ビット

Q A社ワープロソフトで黒A赤Bという文字をB社ワープロで読むとどうなるか。(ヒント) ビット列 0000 01000001 0101 01000010 を 00 00010000 01 01 01010000 10 と切り直しB社の規則で読み直す
要点は、各ビット列対応文字属性や文字飾が、ソフト開発メーカー独自性に左右される点である。ビット列を切り分け、具体的文章表現とし実現させるのがワープロプログラムである。ワープロ文書形式がメーカー毎で異なり、そのメーカーのワープロソフトでしか正しく読めない点はユーザに不満だが、メーカーを縛る規格が少ないことは技術競争を進める利点もある。最近は、他社ワープロ作成ファイルのファイル変換プログラムを用意し、できるだけ同じ文書イメージで読めるようにし、他社メーカーワープロ使用ユーザーを自社ワープロユーザーにしたい競争原理が生み出した結果だが、ユーザーにはワープロを変えても既存文章を再利用できる効能を生む
文字化け原因
  1. 漢字だけのEメールが文字化けする原因は、発信通信文の漢字が別コード文字と置き換わることに起因
  2. Eメール機能を使いバイナリファイルを「添付ファイル attatchment file」で送ると起こる。Eメールは本来、単純な文字コードのみの通信から始まった。この本質は変わらず、画像等の添付ファイルも伝送時は、「添付ファイル → 変換プログラム → 文字コード → 復元プログラム → 添付ファイル」という手順で伝送され、一端文字コードに変換され通信される。添付ファイル文字化けは、復元プログラムが適切でないと起こる
文字化けと別問題だが、添付ファイルは作成したものと同じソフトがないと、復元プログラムがあっても受信者は添付ファイルを開けない
バインディング binding: テキストデータに文字色や文字サイズの様な情報を付加すること
バインディング形式ファイル: ワープロソフト文章等APソフトの保存ファイル

トレードオフ: バインディング情報増 = 表現豊か → ファイルサイズ増え処理速度遅くなる

テキスト形式保存: バインディング情報を省いたテキスト部分のみの保存ファイル
AP利用ファイルは、通常、装飾用バインディング情報用領域を予め用意している。この領域は、ワープロで黒色文字だけの文章を作る場合でも確保される。プリントアウトした印刷物では同じに見える黒一色で文字飾りの無い単なる文字文章を、エディタで作ったファイルとワープロで作ったファイルサイズ(ビット数)を比べると20倍以上違うことも珍しくない。文字だけのEメールをワープロ添付ファイルで送るべきではない問題がここにもある
進化と再利用
バインディング情報は、普通ソフトウェアメーカー毎で異なり、異なるソフトで作られたファイルは相互利用できず、「互換性」がない。テキストのみファイルは、最も互換性が高いファイルとなる。ファイル互換性問題は、同一メーカーソフトでも起る。ソフトは、ユーザの声を聞きながら改良されるが、改良で、新機能追加の他、旧機能廃止もあり、同メーカーソフトでも、バージョンアップで読み取れなかったり異なる働きをする場合がある。互換性問題は、プログラミング言語でも起る(泣ける)。ソフト利用時は、ソフト進化を頭に置き、将来利用可能(再利用)ファイルは、必要に応じファイル変換する等の対応が必要となる。ソフト改良は生物進化に似て「進化」と言われる
互換性が無いと再利用に不便である。普及ソフト作成ファイルは、別メーカソフト利用のためにファイル変換ソフトが開発されるが、変換は双方共通部分という制約がつく。バージョンアップは、新機能追加が多いため、「旧ソフトファイルは新ソフトで扱えるが逆はダメ」が常である(上位互換バージョンアップ – Micro$oft製品にはない)
Q 再利用を文書ファイル利用の他に、体育大会プログラムのように類似形式を何回も使う時は雛形を作り変化部分を差し替え作業効率を上げる。ワープロ文書・表計算、プログラム等の再利用を調べよ
バイナリー(binary)データとバイナリーファイル
プログラムでCOPYと書くと、32 b (8 × 4)必要だが、プログラム言語のように命令数が256以下だと8bで全命令対応コードが作れコンパクトになる。'全国国民体育大会'を'国体'、'personal computer'を'パソコン'、'PC'というのと同じである。プログラムをコンピュータ実行形式変換すると、コンピュータで実行可能な機械語変換され実行ファイルは大きくなる。「レスカ3」と注文を聞いた人は、「レモンスカッシュの元を3人分用意し、3つのカップに入れ、炭酸水と氷を入れ、レモン片を乗せ仕上げる」と考える。この作業手順置きかえが実行プログラム展開である

数値表現

コンピュータは、当初は計算目的に発明された。365という数値は、コンピュータ内部で「3」という数字コードと「6」「5」というコードをつなげたビットパターンで数値表現していると考えがちだが、殆どのコンピュータではこのような形で数値を扱わない。数字は文字の1種としての記号であり、数値を表現しているのではない。普段使う十進法数値は、それに対応させた2進法として符号化されている。数値符号化には、文字に見られない次の問題がある
  1. 文字と違い数値は+∞から-∞まで存在し、単純にビットパターンを割り当てると無限パターン必要となる。この問題は、表現可能数値範囲を限定し(数値使用バイト数制限、固定長)、範囲外の数値処理はプログラムを工夫することで回避される。8桁表示電卓(卓上電子計算機)で20桁計算をする時の工夫と似ている
  2. 扱う数には、0、正整数の他、負整数もある。これらの表現はコンピュータ計算回路とも関係し文字のような単純なビットパターンとの対応ではいけない
正整数に限った表現
単純には、二進法表現を位取り原理に従い計算した結果を十進法数値と対応させるもので、0以上の整数(非負整数)をビット列表現する場合、2進数表記が一般的である
Ex. 3bを用いた2進数。(101)二ビットパターンを1 × 22 + 0 × 21 +1 × 20で示す整数値の5と見る。2B (16b)固定長に適応すると2バイト表現ビットパターンは65536だから0から65535までの正整数が表せる。このように2バイト全部を0と正整数に対応させる方法を「符号なし整数」という

______0__1___2__3___4__5__6___7
ビット列 000 001 010 011 100 101 110 111

23 = 8なので0-7までの整数が表せる。計算問題を数値に割り当てると、1 + 2という計算結果の3は011ビットパターン表現できるが、4 + 5は答の9の対応ビットパターンはない。この問題は、いかなるビット数を数値に与えても起る問題である。計算結果が用意したビットパターンを越えるとコンピュータは「桁溢れ(オーバーフロー overflow)」エラー処理を行う。エラー発生判定は、計算部分に桁溢監視プログラムを用意し判定する。エラー判定のないアンダーフロー underflowはより深刻である
a2b2 = (a + b)(ab)はコンピュータでは必ずしも成り立たない。3ビット表現でa = 3, b = 2とし計算すると、左辺は32 = 9でオーバーフローが起こり、右辺は(3 + 2)(3 - 2) = 5 × 1 = 1で桁溢れしない。コンピュータで正確に計算させる工夫は頻繁に必要となる(「数値計算 numerical calculation」分野)
正負の両整数表現: 負数まで表したい場合

Ex. 16b = 65536のパターンに0と正負の整数を割り当てる方法

符号なし整数と同様表現で全パターン半分の0000000000000000=(0000)十六から011111111111111=(4FFF)十六を0から正整数32767に割り当て残りを負整数に割り当てる。問題は、残る1000000000000000=(8000)十六から111111111111111=(FFFF)十六までのビットパターンに負整数に割り付ける規則である。当然計算上うまく扱えるよう対応させる必要があり、そのように考え出されたのがコンピュータで多く使われている2の「補数表現」である
補数による負の数の表現
負数表現を考えるポイントは、絶対値が同じ正整数と負整数を加えると0になることである。二進法の足し算の基本規則は次の単純な4つに過ぎない
足し算:
  1. 0 + 0 = 0
  2. 1 + 0 = 1
  3. 0 + 1 = 1
  4. 1 + 1 = 10
この計算規則をもとに、各正の整数と、負の整数候補に残したビットパターン

1000000000000000(8000)十六から111111111111111(FFFF)十六

と正の値との足し算を行うと、面白い規則が発見できる。簡便に3b = 8種類のパターンで行ってみる。負以外の整数は0, 1, 2, 3の4種類で、それぞれ(000、001、010、011)に対応ずけした。問題は残りの負の整数-1, -2, -3, -4を候補パターン(111、110、100)にどのように対応させるかである。絶対値が同じ正の数と負の数を加えるとゼロ(0)になることを考え、幾つかの組合わせの計算をすると、次のような興味深い組合わせが見つかる
    十進法表現        1              2              3

    二進法表現       001            010            011
                 001+111=1000   010+110=1000   011+101=1000

正の数と候補パターンの和の例

「最上位ビットを無視し下3桁を見る」という規則で和の結果を見ると全て0の表現と一致する。111、110、101を4ビットでの-1、-2、-3、残った100を-4としてよさそう。念のため、今の規則で十進法表現の「3 - 1 = 2」や「1 - 4 = -3」の計算でもうまくいくか確かめてみた

011 + 111= 1010 下3 桁の010 は、十進法表現の2
001 + 100= 0101 下3 桁の101 は、いま決めた規則で十進法の3
011 + 111= 1010 下3 桁の010 は、十進法表現の2
001 + 100= 0101 下3 桁の101 は、いま決めた規則で十進法の3

このようにうまくいくのは、次のような二進数計算と対応しているから

1- 1 = 1+ (1000- 1)-1000 = 1+111-1000
10-10 = 10 + (1000-10)-1000 = 1+110-1000

補数表現では、「全ビットが1」を-1に対応させ3ビットの正負表現では次のように対応させる
    数           0    1    2    3    -4   -3   -2   -1
    ビット列     000  001  010  011  100  101  110  111

同じビット数で負数まで表すため、正数については表せる範囲が半分になっている。次の規則で正負を判定する。最上位(一番左)のビットが1なら負、0なら正となるが、この対応には大きな問題がある
    十進法              二進法             比較

    (-4) + (-1) = -5    100 + 111 = 1011   1011 = (3) + ?a
    (+2) + (+3) = +5    010 + 011 = 101    101 = (-3) + ?b

?aは、桁溢(オーバーフロー)規則で対処できるが、?bはそう単純ではない
メモ 計算機整数処理: 32bや64bの2の補数表示多用 → 32b: 10進数で10桁程度まで扱える
Q コンピュータは、表で示した対応で正負数値を扱う。表で間違いなく計算できるよう、オーバーフロー対応規則を見つけよ。(ヒント)色々な場合の組合せを行い、規則発見する
ある正数の2進法表現のビットパターンAが与えられた時、全ての1と0を入れ替え出来るビットパターンを、「Aに対する1の補数」という。「1の補数」に1を加え出来るビットパターンを「Aに対する2の補数」といい、コンピュータでは、絶対値Aに対する負数(-A)として扱う。なお、「2の補数」を使った0及び正と負の整数を扱うやり方では、最高位のビットが0の時は正、-1の時は負となる。このような方法で正と負の数の表現を補数符号付き整数という
2の補数を使うと、今のように引算が足算でできる。足算回路1つで加減という2計算ができ、コンピュータの演算回路を単純にできる。しかし、2の補数を作る回路が複雑なら意味がない。機械的にビットパターンを反転させるという回路は足算回路よりなお簡単なので問題ない
Q十進法で「12345-5678」「5678-12345」を、2の補数を利用した16ビット2進法表現で行え
Q 16ビット表現の符号付き整数で扱える整数は-32768から32767に過ぎない。このため、より大きな整数を扱う32ビット表現(4バイト)も利用される。32ビット表現」で扱える符号付き整数の範囲を確かめよ 実数表現 数値計算で本物の実数は扱えない
実数表現は「小さい値を単位に」表現できるが、(絶対値が)非常に大きい数や小さい数を表すには不便で、指数方式(浮動少数点)を使用する。電卓に指数部と仮数部(有効数字部分)を分け表示/計算するものがあるが、それと同じと考えればよい。この方法では次の情報を組合わせ1つの数を表現する

全体符号(1b): 数正負を表す

仮数値: 0-1の値を適当な刻み幅で表す

指数符号(1b): 指数正負を表す

指数値

2進数だと見にくいため210 = 1024だから指数も仮数も10bずつ(全体では符号を含め22b)で仮数は0:000-1:000(0:001きざみ)、指数も0-1000の値として10進数の形で表す(図2.14)。

↓全体の符号__________↓指数の符号
▓-----------仮数部-----------▓-----------指数部-----------
1 bit__________10 bit___1 bit__________10 bit
図. 実数の浮動少数点表現

この表現では次のような数が表せる

○ 1:000 101000 表せる数で絶対値が最大
○ 0:001 101000 表せる数で絶対値が最小(0は除く)

非常に広い範囲の数が表せそうだが、次のものは表せない

× 3:142=0:3142 101 仮数部は3桁までしか表せない
× 1234 = 0:1234 104 仮数部は3桁までしか表せない

指数方式表現では有効数字(significant digits (significant figures)桁数が決められ、絶対値が大きくなると表せる値の刻みも大きくなる
実数表現は、定ビット数で表すため、整数同様、「表せる最大値・最小値」がある。実数では「表せる最少刻み幅」も問題である。コンピュータ上の実数は数学上の実数と違い「近似値」になる。コンピュータでは、実数表現に64b以上使用し、より細かい数値となるが、原理は同じで限界があることは変わらない
数値表現と誤差
実数取り扱い時に十進法計算でも見られるがを3.14とし計算するとは無理数(3.14159…)で誤差がある。分数2/3は0.666…という無限小数である。誤差は、有限桁でしか扱えないコンピュータで必ず出る。コンピュータ計算では、別種類の誤差が存在する。それは十進法では有限確定値となる小数が、2進法で数値を扱うコンピュータでは無限小数になり、それを有限で打ち切るための誤差である
Ex. (0.2) = (0.011011011……無限に繰り返す)
十進法の0.2は、単位1の1/10 (0.1)の小単位2個分だが、それを2進法で表す。2進法の(0.1)に対応する小単位は、単位1の1/2(十進法の0.5)で大きすぎる。そこでこの小単位の更に1/2(十進法の0.25)、更に1/2の単位(十進法の0.125)というようにより小さな単位を作り、それらの組合わせ十進法の0.2を作ると(0.00110011011…)となる。この関係は1/3を十進法の小数で表わすと(0.3333…)と無限小数になるが、三進法なら(0.1)となるのと同じである。計算に伴う小数誤差を小さくすることは数値計算分野の研究対象である
Q「仮数5桁 + 符号、指数2桁 + 符号」表現で次の計算を実行すると結果はどうなるか。その違いはなぜ生じるのか

1) 3.1416 - 3.1234 + 0.0000001
2) 3.1416 + 0.0000001 - 3.1234

注意点は、指数部も仮数部も表せる桁数は固定なことである。(10進数)指数2桁 + 符号、仮数5桁 + 符号とすると、10000000000 = 1.0000 × 10+10, 0.0000000001 = 1.0000 × 10-10等の値は表せるが、これらを足すと10000000000.0000000001 - 1.0000 × 10+10と近似値に丸められ、「0以外を足しても値が同じ」になる。123456という数値でさえ、123456 - 1.2346 × 10+05、のように概数でしか表せない。実際のコンピュータでは指数部も仮数部ももう少し余裕があるが問題は同じで、有限ビット数のデジタル表現では原理的に避けられない制約である
文字数値混在ビットパターン読取
コンピュータ使用目的は、情報処理結果を得るためで、文字数値表現決めただけでは不十分である。個々の単語を知っていても文法知らなければ文章を作れないよう、ビットパターン表現された文字数値の集まりは処理手順を書いたプログラムに従い読み取まねばならない。文字と整数型や実数型の数値が混在したファイル(ビットパターン集合体)から、文字数値読取り方を見てみる
2B(16b)ビットパターンで数値表現すると、JIS漢字コード表現と重なるものが出てくる。文字では使わないビットパターンということがあるが、数値を一定長ビット表現する場合、数値の性格から全パターンが起りうる訳である。この重なり問題を解決し、誤りなく「今は数値ビット列」「次は文字」とプログラムが解釈できるよう、要素となる文字コードや数値コードの集まりは工夫しメモリー配置される。基本的考え方は固定長と分離記号の発想をもとに、「読み取り文法」を作る点である
Ex. 仮想的に読出し規則を決める。データファイルは次の規則で読み出す。ファイル先頭1bは文字か数値を指定している。0なら文字、1なら数値である
→ 0の時(数値)

+ 2b: 数値種類
00(符号なし整数)、01(符号付整数)、10 (符号付小数)、11 (符号なし小数)
+ 2b: 数値サイズの固定長 0 (2B長)、1 (4B長)
+ 2B: 数値個数を符号なし整数型で示します。Ex. 2B型で、ここの値が150なら、300B先で数値データ終了
+ 1B: 0ならファイル終了、1なら繰り返し

→ 1の時(文字)

+ 2b: 文字コード種類
00(ASCII)、01(拡張ASCII)、01(JIS漢字)、11(S-JIS)
+ 2b: 文字数を符号なし整数型で示す。Ex. JIS漢字で、ここの値が150なら、600B先で文字データ終了
+ 1B: 0の時、ファイル終了。1なら繰り返し

このように0と1というビットが並ぶファイルから、適切に文字や数値を誤りなく切り取り読み出せる

デジタル信号とアナログ信号digital singal and analog signal

文明・文化は、文字や数値という「記号」や、絵画、音楽、重さ、電流の値といった「モノの状態」、食料、衣服といった「モノ」自体により出来ているが、記号表現できる情報は、ビットパターンに限られた。それは、記号が「数えることができる」性質を持っていたからである
デジタル情報: 「2N通りのどれか」というビット列の形で表される離散的情報
アナログ情報: 長さ重さ等のように連続的情報のこと → 量子化: アナログ情報を最少の細かさを定めデジタル情報に変換すること
デジタル情報は「中間的状態」がない(離散的)、離散量からなる。離散量は、電磁気的に2種類のビットから作られる組合わせパターンに対応させコンピュータ処理が可能となる。一方、連続的情報をアナログ情報といい、その量を連続量(アナログanalog量)という。重さは、1 gと1.1 g間に1.05 g、1.032014…というように無限の値が可能である。これらは、通信ではデジタル信号アナログ信号という
コンピュータは、正確にはデジタルコンピュータというデジタル情報処理機械である。アナログ情報は、テープレコーダーや電話のように電磁気的表現されてもアナログ情報でありコンピュータ処理できない。アナログ情報をコンピュータ処理するには、デジタル情報変換が必要である。アナログ情報をデジタル情報変換処理する背景には、デジタル化の手間を上回る利益があるからである。実用的には、一定の値を単位とし、それが幾つあるかという形に読みかえアナログ情報をデジタル情報変換する(量子化)。ヒトの身長を表すには1 mm単位で十分だろう。身長は4 m以下だから212 = 4096で、ヒトの身長は12ビットデジタル情報で表せるが1 mmより小さい部分の情報を捨てていて、これを量子化誤差という。より精度の高い値が必要ならより多くのビット数を用いる
Q 情報で、主に1)アナログ情報、2) デジタル情報、3) アナログでもデジタル情報として扱われるものを考えよ
アナログ情報の伝送と記録
振幅変調 amplitude modulation, AM: 情報を搬送波強弱で伝達する変調方式
周波数変調 frequency-modulation, FM: 情報を搬送波周波数変化で伝達する変調方式
アナログ伝送: 情報源(音源)のアナログ情報(振動)を「そのままの形」で別媒体(メディア)の状態(振動)に写し取り送る方法
Ex. 「おはよう」という言葉の伝達: 声帯が「おはよう」と振動 → 声帯振動はその振動状態を写し取る形で周りの空気を振動させ広がる → 空気振動が鼓膜に届く → 鼓膜は空気振動を写し取る形で振動 = 伝達完了
Ex. 機器アナログ信号伝送: 空気振動をマイクで電圧変化に変換し、時間と共に電圧変化する様子を伝送し、受信側でそのままの形でスピーカに送ることで再生される

digital 図. 減衰とノイズ

アナログ伝送の問題減衰、雑音
通常会話は、空気を媒体に行われるが、媒体に代わりに糸を使うのが糸電話、電流振動が電話、電波が無線電話である。このように伝達媒体は変更される。音伝送は、途中の伝送媒体が変わっても、「発信側-アナログ状態媒介物-受信側」という仕組は変わらず、アナログ伝送には、次のような問題点がつきまとう

digital 図. 音の伝送

減衰 damping,or attenuation: 音を遠くまで伝えると音が小さくなるよう、元情報が伝送に従い小さくなること
雑音(ノイズ) noise: 取り扱う情報につき歪めるもの全て
雷でテレビ画面が乱れるのは、画像情報電波に雷電波が加わるためである。ノイズは積み重なる性質があり、個々のノイズは小さくても伝送が長くなるにつれノイズの影響は大きくなる
減衰対策に、減衰しにくい媒体開発や信号増幅が行われるが、増幅はノイズも増幅させる。雑音対策に、雑音を拾いにくい材質開発、ノイズを通さない性質のフィルタ装置を挟み除去が行われるが、フィルタで効果的に取り除けるのは、元信号と性質が大きく異なるものに過ぎず完全除去はできない

digital 図. 信号のアナログ解釈とデジタル解釈

アナログ記録の問題記録媒体の劣化
鼓膜(振動膜)に針をつけ回転板にあてると針の振動に応じ溝が刻まれ、この溝に針を置き板を同じ回転で回すと針は溝形と同じ振動をし、それが振動膜に伝わると音が再現できるのが、レコードの基本原理である。情報源状態を、「そのまま」記録媒体にコピーするのがアナログ記録の本質である。アナログ記録(伝送)は、情報を元状態で取り扱う限り、減衰、雑音、劣化問題がつきまとい、アナログ情報技術は、これらの克服にあるといえる
劣化: 記録媒体は時間と共に変質し、アナログ情報では、質が時間と共に劣化することは避けられない
Q アナログタイプ複写機で新聞(オリジナル、親情報)をコピーする。コピー(子)から、更にコピー(孫)する。この操作を、曾孫…と何度も繰り返し、画質の落ちかたを確認してみよ。カセット、ビデオでも確かめよ
アナログ情報のデジタル化発想の転換
芭蕉が書いた俳句の短冊は、短冊そのものの骨董的「モノの価値」と、俳句表現の「意味の価値」がある。「意味の価値」は、短冊に虫食い(雑音)があっても、離れて見える文字が小さくなっても(減衰)、墨跡が薄くなって(劣化)も、読めれば価値は変わらない。点字でも同じである。アナログ情報のデジタル化の本質は、このことに深く関係する。コンピュータ内部やデジタル通信は、ビットパターンを電気パルスpulseで扱う。1電気パルスを電流波形(アナログ情報)に注目すると、波形は電線を流れるに従い、雑音の影響を受けたり、減衰する。波形でなくパルスが「来た、来ない」なら1パルスが1つと認識できればデジタル情報価値は減らない

digital 図. パルス中継

C君は予め、3ボルト以上に飛び出した波形があれば、「5ボルト矩形パルス送信」、と決めていた。やり取りするパルスを、形(モノ)ではなく個数(意味)に着目すれば、雑音減衰の影響は改善されます。雑音減衰の影響が無視できないほど遠くに送る必要がある時は、途中にパルス波形を整形する中継点をおけばよい
アナログ情報とデジタル情報の相互変換
アナログ情報をデジタル情報で表現できれば、アナログ情報の持つ諸問題 (Ex. 伝送・記録、複写時におこる減衰、雑音、劣化) が解決できる。カメラで撮影したカラー写真は、時間と共に変色するが、デジタルカメラ撮影写真に色の劣化は起こらない。記録媒体が時間的に品質低下を起こせば読めなくなる恐れがあるが確率は低く、デジタル信号は、親、子、孫と何段階複写しても品質劣化が起こらないため、バックアップコピーにより解決できる
メモ 音楽テープ無断コピー → 著作権違反: アナログダビングは、音質劣化から不法コピー問題は表出しなかったが、記録媒体劣化前にコピーを繰り返せばオリジナルと同一物の複製ができるデジタル情報記録技術出現により、不法コピー問題は深刻化した。デジタルテープレコーダーでは、オリジナルコピー時に複製と分かる仕組で複製禁止をしている。不法コピー問題は、情報社会で深刻になった問題の一例である
アナログ/デジタル変換 (A/D変換analog/digital conversion): アナログ情報をデジタル情報に変換すること

AD変換器analog-to-digital converter, AD converter (ADC) ↔ DA変換器digital-to-analog converter, DA converter (DAC)

PCM, pulse code modulation: 音声や楽器音等のアナログ音声信号をデジタル信号に変換する方式
音声をA/D変換し伝送すると、音声波形ではなく電気パルスでビットパターン伝送され、受けとった側がそのまま聞いても音声認識されず、デジタル情報をアナログ情報に戻すデジタル/アナログ変換をする。細かい時間間隔毎に電圧を調べ(サンプリング)、電圧大小をデジタル化伝送し44000回/1秒(44 kHz)等のサンプリングを行い、各サンプル値を16b表現する(音楽CDも同様なデジタル記録法)
MIDI, musical instrument digital interface: 譜面や演奏手順等のデータをシンセサイザ等電子楽器間やPCと楽器の間でやりとりするための標準仕様。 Ex. 通信カラオケ譜面データ
音声表現形式
音声情報圧縮表現方式に規格がありμ-law、AIFF、WAVは代表的音声表現形式名
WAVE (.wav): Windows無圧縮標準音声ファイル形式。多くのプラグイン/ソフトウェアが対応する。WAVEファイル作成・配信にはWMP 7開発ツールのエンコーダやフォーマットが必要
MP3 (.mp3): MP3(MPEG Audio Layer-3): MPEG-1音声データ圧縮技術のみを適用作成した音声ファイル。CD並音質を保ちWAVEファイルを1/11に圧縮する。下位技術のMP1 (MPEG Audio Layer-1)は1/4,MP2 (Layer-2)は1/7の圧縮率。再生はWinamp, WMP, RP 8 Basic等でできる

MPEG, Moving Picture Experts Group: ISO設置の動画技術専門家組織名がファイル形式名称になった

RealAudio (.ra/.ram): RealNetworks社(旧Progressive Networks)開発音声データ圧縮音声ファイル。RealAudio再生用プラグインであるRealAudio Playerは、Internet ExplorerやFireFoxに標準装備だが、開発元RealNetworks社の上位プラグインである RP 8 Basic等で再生するのも一般的
AIFF (Audio IFF) (.aif/.aiff): Macintosh標準音声ファイル形式。再生用プラグインはQT Playerだが、WMP 7, RP 8 Basic等も対応。ファイル作成配信はQuickTime上位製品QuickTime Pro (有料)が必要
Advanced Streaming Format (ASF), (.wma): Windows Media Audio: Microsoftマルチメディアファイル統一ストリーミング方式ASF音声データ圧縮方式でCD並音質再現可能
Advanced Audio Cording, AAC (.aac): 映像データ圧縮方式MPEG-2/4中、音声データ圧縮技術のみを適用作成された音声ファイル。MP3より圧縮効率が約1.4倍高い。再生にはK-jofolが対応
AU (.au): AU (Audio)はUNIX標準音声ファイル形式。再生にWMP 7, QT, Winamp, Plugger等も対応
アナログ/デジタル変換原理
A/D変換 = 標本化sampling → 量子化quantization = 2段階

標本化: アナログ情報波形が、時間軸に沿い等間隔Wtの点列、T0; T1; T2; … Tnをとり、その波高値を読み取る
量子化: 波高値連続量(アナログ)小数値部分を整数近似し波高値とする

量子化単位は、取り扱う波形を取りうる最大電圧を1/2Nとする(Ex. 最大波高値5 V, N = 8 → 5256 Vが単位1)。この場合、量子化値は0-255の値で8b (1B)固定長ビットパターンで表わせる。Nを大きくすれば誤差の少ない量子化となる。量子化された各波高値を二進法で表現する電気パルス列によりA/D変換終了し、元アナログ波形が対応する電気パルスの集まりとしてデジタル信号表現される。D/A変換は、逆で、送られて来きたパルスから量子化された各値を読み取り、それぞれを高さとする幅Wtの階段型の波形とし再生する

digital 標本化___________________________量子化
元のアナログ波形は、間隔毎に、波高1, 9, 13, 1,3 10, 6, 6, 7, 5, 1でデジタル化された
図. アナログ信号のデジタル化(標本化と量子化)

アナログ/デジタル変換に伴う誤差問題と標本化と量子化の基準
A/D変換で得たデジタル情報は、伝送等ではアナログの持つ雑音等の諸問題は起りにくくなるが、A/D変換(デジタル化)中の標本化と量子化の段階で誤差が入る。標本採集のための時間間隔Wtを小さくし、量子化刻み個数(N)を大きくすれば、誤差は小さくできる。標本化間隔を無限に狭くし量子化の刻み個数を無限に大きくすれば、完全に元情報を再現できるが、誤差を減らすほど情報量が増えるトレードオフが起こる。トレードオフ問題は、音では人に聞こえない音を扱わないことで解決を図る。音の性質は振動周期(振動数)と振幅で決まるが、「アナログ波形最大振動周期(最大震動部分)の半分間隔で標本化すれば、元波形復元可能」(標本化定理)なため抽出間隔Wt基準値が決まり、音の強弱の違いを聞き分けられる能力(聴力分解能力)から量子化レベルNが求まる
Q電話を通したCD音楽は、直接聞く音と随分違う原因にA/D変換が関係します。理由を考えよ。(電話は人間の声を基準に作られ、聴力は1秒間20-2000 Hz (1秒間1回振動が1ヘルツHz)程度の音域を聞き分けるのに対し、人間の声は100-3000Hz程度の音域しか出ない。楽器の音域は人間の声より広く、大きな音が出せる)
時間変化するアナログ量をA/D変換利用するには、誤差問題に加え処理時間問題がある。1/103秒間隔で標本化しN = 256で量子化したとする。量子化値に対応する電気パルス1b分幅が1/103秒とし、それを1本の電線で8ビットパルスを順に送るのでは波形は最低8/103秒に引き伸ばされ実用化できない。8本の電線で一度に送る、パルス幅を短くする(1秒間処理数を増やす)といった工夫が必要となる。32b CPU 400MHzとは、1秒間処理パルス数や同時処理ビット数を示したもので、この値からコンピュータ性能の目安がつけられる ウェーブテーブル wave table は、楽器音等の「生音」を標本化した波形データで、GMでは128音を規定する

[三大革命]

情報社会と生活


コンピュータ社会のもたらすもの
電気製品内蔵マイクロコンピュータ → 高度サービス提供: 製品差別化行える便利な商品
マイクロコンピュータ組込家電: 多くの家庭電気製品(家電)に組込まれる

Ex. 音楽ダビング: 内蔵コンピュータが時間計算し長さに応じ曲順替える
初期: PCの歴史同様、単体使用 → 家電製品のコンピュータ同士のデータ通信ができ情報家電製品誕生

社会情報システム: 社会生活は、生産地-消費地を結ぶ流通システム、クレジットカード信用確認のための金融システム、年金支給等を管理する年金システム等、様々な情報社会システムによって支えられる

システム: 交通管制 + 電話網 + 社会保険 + 住民DB + 電子決済 + 在庫物流管理 + 銀行証券オンライン + 住民票DB + 無人交通 + 自動制御 + 図書館DB + 特許情報 + 意志決定支援 + 気象予報 + POS + 在庫管理, etc. = 社会
図1.1 社会を支える情報システム

Ex. 交通管制システム: 混雑状況から信号時間調整し事故発生情報電光掲示板表示。カーナビにより衛星送信電波を元に自己位置計算。交通情報提供サービスで電波により事故情報送信 → 融合: 電波送信で事故情報取得し現在位置とカーナビ組込地図データから迂回路を計算し解を運転手に知らせ事故未然防止や最適ルート走行可能


_交通制御 ←←←←←←← 交通制御 ←←←←←←← 交通制御
_(コンピュータ)__________(コンピュータ)__________(コンピュータ)
__________________⇗⇗⇗________________________
[]__[]________∀ (センサ) []__________[]___[]


図1.3 交通管制システムのシステム構成図

交通管制システム: ハードウェアは、交通量測定センサー・信号機・周辺装置と通信回線・コンピュータで、ソフトウェアは、通信制御・データ解析・信号機制御プログラム等で構成される。車の円滑な流れには、複数信号機連携必要で、信号機を1コンピュータで集中制御したり、地域毎の信号機制御用コンピュータを通信回線接続しコンピュータ間連携を図る分散制御方法がある

Ex. 高速道路料金集金システム: 車から出る電波で車特定 → 車移動経路求め高速料金を銀行口座から自動引落し → 料金所付近混雑緩和
Ex. コンピュータ利用は、エンジン回転数に応じたバルブ制御等だったが、車間距離計測し運転手に警告出し路面反射波を読む自動運行システム等が開発された

情報システム
時間や場所の制約を緩和

Ex. 銀行 (過去 = 現金引出は営業時間内に窓口へ通帳印鑑を持ち行く)

現在 = 預金者預金残高ネットワーク管理。預金者から預金や引出があるとネットワークで預金残高調べ適切処理を行う。現金自動支払機で銀行窓口終了後も引出せ、ネットバンキングにより携帯コンピュータで残高照会や振込ができる。デジタルキャッシュdigital cash (DC)で買物もできる。お金は物と交換する象徴の一型であり、デジタルデータは現金同様に使え、お金と等価となる。DCは、暗号化デジタルデータが現金同様に扱え、通信回線を通じ送付できる。紙幣や硬貨を運ぶには物理的手段をとるが、DCはEメール等で添付送信も可能となる。ネットバンキングサービスでは、携帯型コンピュータを持てば現金自動支払機を持ち歩くのと同じで、いつどこでも引出振込できる。印鑑に変わり、「暗証番号」を使い認証できる。利子計算や他銀行等への振込にもネットワークは活躍し、日本貨幣の外国貨幣両替に銀行は予め外国貨幣を用意するが、貨幣はネットワークを通じ海外取引を使い入手するのが普通である

bank
図1.3 銀行からお金を引き出す方法の昔と今の対比

携帯情報端末 PDA, personal digital assistant: 携帯可能なPIM用ハードウェア (電子手帳進化型)

→ スマートフォン

Ex. 商品流通: 大量の流通情報や価格情報等がネットワークを使いやりとりされる

金融業: 預金残高・貸付金額管理等にコンピュータ使用。外国為替取引等: ネットワーク取引
shop
図1.4 インターネットショッピング: 海外製品も容易に購入でき、情報社会は自己欲求を把握する必要がある

プッシュ型とプル型 - 主体的に情報を得る

プッシュ型メディア: 受信者が意思選択なしに得る情報 Ex. 広告チラシ
プル型メディア: 受信者が積極的に得る情報 Ex. W³ (WWW) = 閲覧しなければ情報は得られない

→ 必要な時に情報源のサーバに取りに行くため最新情報が得られ無駄な配送がない → W³ (ニュース自動配信サービス等プッシュ型もある)

新聞広告は地域限定できても読者の興味に応じ配り分けできないが、インターネットニュース(NN)自動配信では、アンケートに答えると、それに基づく内容のみ配信される。あるカテゴリ分類された情報が入手できても、送られる個々のニュース内容を自分で選択した訳ではないプッシュ型メディアとなる。情報社会では嗜好品検索容易となり、プッシュ型メディアと比較し主体的に情報入手する方法の割合が大きい特徴がある
Qプッシュ型情報とそうでない場合(W3検索等)の情報発信側、情報受取側、情報内容による差違を考えよ

欲しい物を安く買う = 情報収集必要: 価格と値段の情報
1) 店にしかない → 店に行く
2) 広告チラシ / 新聞・テレビ・書籍等 → 店に行かなくてもよい

情報発信量に限界 + 商品の存在知らず入手できないことも

情報公開

インターネット = 行動範囲越えた情報入手可 → 産業形態変化・新産業誕生

店: 情報伝達ないと販売促進不可 → 情報発信格差は利益に直接影響 → 売上向上のため情報公開

企業経営: 情報公開は企業独自性の追求でもあり、他社を越えた技術やサービスを知る

消費者: 情報収集は生活向上に不可欠 → 自主的に(商品)情報を集め購入する消費スタイルに変化

情報発信しない店(企業)は無視 Ex. W³ページ広告を出し消費者が情報検索購入する消費形態

→ 相乗効果で情報社会発展

情報処理技術と企業の関わり
  1. 産業効率化等: 企業活動に情報処理技術活用
  2. 情報処理 = 企業活動: 情報処理技術生かし情報そのものや情報処理システムを商品化
Ex. 1. 企業における情報価値と情報処理技術: 企業間競争を優位に進めるには情報は必須

検索エンジン等使い消費者は自宅で豊富な情報を得る → 検索され易いページ作成必要
W³ページ広告で、購入者範囲拡大し競合相手特定しづらくなる。店は広告費用を節約し売値下げ、全国通信販売が店の主販売形態になれば店舗や販売定員を縮小できる。売上げ向上には、販売定員配置ではなく、情報発信であり、店の特徴・独自性が求められ顧客が欲しい商品を揃えられことが重要となる
W³ページは、発信と同時にアンケートやメールをもらえる双方向通信機能があり、容易に消費者ニーズ得らえ、消費者嗜好を的確に掴み、商品企画に生かすことが企業に重要視されつつある

Ex. 2. 小売業(コンビニエンスストア)におけるコンピュータ利用

生活用品等購入 + チケット購入 + 公共料金支払 + …
店端末は、本社コンピュータと通信回線接続され、店内端末操作によりチケット情報が送受信され購入できる。コンビニは店舗とコンピュータセンターを通信ネットワークで結び、新サービス提供が可能となった。コンビニは、小売店/チケットセンター/銀行となり、情報処理技術により業種を越えた新産業が生じたといえる

TCO, total cost of ownership: コンピュータ仕様に関する、導入・運用・保守、と教育等の全経費
Ex. 3. POS (Point-of-Sale) システム: 通信と繋がったキャッシュレジスター

バーコード barcode: 商品コード(国・企業・企業内商品コード)を記録 → 商品価格レジ入力省力化

値段変更は商品値札を付け直さずバーコードデータベースの商品価格変更するだけでよい

コンピュータ通信利用喫茶店: 店員は注文を携帯通信端末に入力 → 入力データは厨房とレジに同時転送 → 客にレジ清算用コード振った伝票渡す → 客が店を出る際、レジ係は伝票コードをバーコード読取機でキャッシュレジスターに読み取らせ、レシート作成し代金を受け取る(ここまでは普通の喫茶店)
威力はチェーン店展開時発揮 → データは通信ネットワークでコンピュータセンターに送付し各店売上状況を把握 = 販売・発注・在庫管理容易 + 売上特性情報から顧客欲求分析 → 商品戦略(POSシステム)

Q 喫茶店のようにコンピュータと通信を有機的に活用している産業を調べよ。今後普及する分野を考えよ
Ex. 4. 企業情報システムでのコンピュータ利用と情報発信

ドキュメント電子化 → 出退勤管理、購買管理等がペーパーレス化 + 電子決済
関連企業間の取引決裁を電子商取引化すると現金移動が減り効率的企業経営が行われる

SET, secure electoronic transaction: Internet等で電子決済等を行う時に使用される業界標準的なプロトコル
企業内では経理・人事・稼働管理、プロジェクト管理、顧客情報販売管理、在庫管理、情報共有等の各システムが社内LANで接続され、イントラネットを構成しDBは連携される

Ex. 市場-工場間業務プロセスを見直し、情報システムを導入しタイムリーに市場ニーズに合う製品を企画生産でき、品揃えが充実し見切りロスが減少し不良在庫を減らせる。個々の顧客取引履歴を蓄積した顧客DBは、営業力を高め顧客満足度を高めるが、販売管理システムと顧客管理システムの連携が不可欠となる(分散システム)

分散システム: ネットワーク上で複数システムが協調し動くシステム → 分散型計算機 distributed computers
機能分散: 各システムの目的別に各コンピュータ分散配置される形態

オーブ (ORB, object request broker): ネットワーク接続した複数コンピュータに分散したオブジェクトの所在を気にせず1台のコンピュータで動くかのように利用するソフトウェア

負荷分散: 同プログラムを複数コンピュータ起動し、入力処理を各コンピュータに振りコンピュータ負荷軽減

→ 並行処理 real time and parallel programming

クラスタシステム cluster system: 複数サーバで構成するシステムを1台のサーバに見立てたもの

フェイルオーバー fail over: クラスタシステム等でシステム障害発生時に実行中の処理を他コンピュータに引き継ぐこと
フェイルバック fail back: 復旧後、元のコンピュータに処理実行を戻す

集中処理システム: 1台のコンピュータで処理するシステム

🏢 社内ネットワーク(イントラネット)
┣ 🗣 経営企画部: 意思決定支援システム
┣ 😃 営業部: (販売戦略の立案) 顧客情報販売管理システム
┣ 🏪 店舗: 売上管理システム
┣ 🚚 商品配送センター: 在庫管理システム
┣ 💻 社内ニュースサーバー
┣ 👥 人事部: 人事管理システム 教育支援システム
┗ 🏦 経理部: 経理システム

図1.5 企業情報システムの例

高額商品購入時には競合商品とデータを比較検討し嗜好商品を選ぶため、商品情報発信により情報付加し商品価値を高められる

Ex. 商店生鮮食料品売場に料理レシピ置く → 消費者は、レシピで食材を決め、商店では生鮮食料品に情報付加し商品価値高め売上げ伸ばす

情報化で、経営効率化とスピード化を促進し、経営者は情報を素早く得て、より的確な意志決定が可能になるが、過去の経験等に基づき創造力を発揮した戦略を立てる意志決定は、今のところコンピュータはできない
Q 商品やサービスに情報付加し価値を高めた例をあげなさい
Q 企業における情報公開の利点と欠点は
Ex. 5. 工業におけるコンピュータ利用
製造業: コンピュータ上製品設計 (CAD, computer aimed design) → コンピュータ制御機械自動的稼動 (CAM)

シミュレーション: 実物実験に変わる
Ex. 強度試験 → 設計日数と設計費用削減 + 様々な想定試験

建築設計: コンピュータ用い建造物強度・地震の影響、ビル風の近隣への影響、ビル影による近隣日照時間影響等を建築前に予測 → 作成図面データはEメール等で関連企業へ転送可能
工場内生産機器をコンピュータ制御し(半)無人工場実現

______🏢______⇒ 設計図データ ⇒__ 🏭 🚗🚗🚗
_____[CAD]_____<──────────>___[CAM] 工場内
コンピュータ使い設計 企業ネットワーク_ネットワークロボット
Ex. 自動車工場: 組立必要部品を紙上設計し、部品工場は図面を元に部品生産 ↔ 従来、自動車メーカーは、販売台数予測から台数分部品注文し部品工場作成部品で組立行ない、自動車を保管場所に停めた ⇒ 今、消費者注文後に注文(色・装備・エンジン性能等)に応じ出荷。在庫車ないと注文自動車生産を行うため保管車出荷に比べ時間がかかった

コンピュータネットワーク活用可能な自動車工場の生産過程 →

組立必要部品設計 = CAD製図システム使用
完成図面 → ネットワーク経由で部品工場に転送(必要個数の注文が部品工場に届く)
→ 部品工場は注文に応じ部品を必要個数生産し納期に納品(販売店からの注文もネットワーク経由し届く)
自動車工場は部品工場から集まった部品を使い注文に応じ自動車を工場内のロボットを使い組立てる
= 在庫がなく、未売の車を保持する必要がない

注文が販売店経由で工場に届くと直ぐ部品工場に発注され、注文した翌日午後には注文車の生産が開始され、数日後に車が完成し消費者の手に渡る。現在の工場生産システムはネットワークなしでは考えられない
Ex. 6. 農業・漁業(第1次産業)と情報処理
→ 生産活動効率化に情報処理技術導入

ネットワークシステム → 特定農産品出荷時期を制御し安定供給。漁獲の多い場所をDB化し効率的漁業

農業: 農作物植付効率の良い時期・畑の位置等を、気温・土壌等を元に判定 + 植付・収穫・出荷機械制御
漁業: コンピュータで運航制御、魚群探知器制御
→ 農作物・魚出荷: 商品流通システムを活用

情報産業

日々、新情報処理技術が開発され新ネットワーク使用法が発明されている。情報そのものや情報処理を商品にする企業もある。情報処理に必要なソフトウェア・ハードウェアを商品とする企業もある
  1. 情報を売る企業: 新聞社・出版社・テレビ局等は、情報を商品とした情報販売企業。辞書・辞典等大量情報をまとめたもの、新聞・ニュース等速報情報、美景・芸能等娯楽性のあるもの等が、情報価値を持つ。情報販売は、新聞配布、本出版、映像・音声放送等「従来型メディア」に対し、インターネット普及に伴い既存メディアに縛られない情報(処理)配布メディアが登場した。規制緩和に伴い、インターネットをメディア採用した企業が従来型メディアに進出しています。個人情報を商品にする企業もあるが、本人同意なしの入手情報を他企業に販売する企業もあり、プライバシー侵害につながり社会的問題となる事件も発生
    ユニバーサルサービス universal service: 誰もが妥当な料金で受けられる通信/放送サービス → 日本: 法律によりNHKとNTTに義務
  2. 情報処理を売る企業: 人(企業)が大量データ計算必要時の処理請負業を「情報処理産業」という(Ex. 企業金銭出納管理をする会計士税理士、大規模アンケートや試験得点処理等を行なう企業)。これらの産業は、情報流通中、情報発信者でも消費者でもなく、それ故、情報流通社会中、非常に重要な位置を占める
  3. ハードウェア産業: コンピュータ生産企業は、元々コンピュータ以外の電機製品生産企業と、コンピュータだけを生産した企業に分かれる。コンピュータ生産部分(パーツ)により企業形体異なる。CPU設計は難しく開発費用嵩み、その特徴が売行に大きく影響するためCPU生産企業は少ない。メモリ部品は、国際規格化部品が多く部品が単純パターン構成なため多企業が開発生産行なうが、生産工場建設も膨大な費用がかかりCPUやメモリの生産企業は大手企業である。パーツの多くは、部品専門の世界中の企業により生産され市場流通している
  4. ソフトウェア産業: コンピュータは、ソフトウェアがあって機能する。ハードウェア同様、ある企業のソフトが普及すると、他企業がその分野に参加しにくくなりる。ソフトウェア作成には、情報科学、特にプログラム作成理論等に通じ、かつ利用者からの希望等を聞き、より使い易いソフトウェアを製作する能力が大切である
情報化の影の部分
情報処理技術は使い方次第で、企業の生産性を下げたり、プライバシー・企業秘密が洩れたり、犯罪につながる。入力情報が外部に洩れると困る情報は、セキュリティ対策を講じないネットワークを用いた掲示は危険である。国際標準化機構(ISO)は、文書管理方法規格を定め多企業がISO基準管理手法に従い文書管理している
Q 各産業におけるコンピュータ活用とその効果を考えよ。コンピュータがないと、その産業はどうなるか
バグ bug: コンピュータの動作に影響を与えるプログラムミス

コンピュータ停止事態生じたり、誤動作し死傷者を生じた場合、プログラマは傷害致死罪に問われることもある
Ex. 信号機制御プログラム = 安定動作保証必須
Ex. 預金管理データ: 誤りや不正プログラム → 預金が紛失 → 不正プログラム作成者 = 窃盗罪

大規模システム構築: 不正プログラム混入避けるシステム開発モラル、チェック体制や仕組が重要
デバッグ debug: バグを探し、取り除くこと
デバッガ debugger: バグ発見・修正作業を支援するソフトウェア
ベータ版 β version: バグ発見に開発中に公開されたソフトウェア等

公共システムには、システム信頼性を高める技術としてデュプレックスシステムduplex systemやデュアルシステムdual system等、ハードウェア多重化を行う

ハッカー hacker (犯罪者: コンピュータ不正侵入技術持つ人(含, 不正侵入者)
ウィルス(computer) virus: 保存ファイルを破壊したりするプログラム群

感染防御: 見知らぬEメール開かない、ウィルスチェック後にファイル転送を行う、定期的ウィルスチェック行う、等
2000年問題(Y2K, Year 2000): 西暦を2桁処理するコンピュータのハードとソフトウェアが2000(= 00)を1900や、PCに搭載されるRTC開始年である1980等に解釈し、誤った動作を起こすこと

情報システム評価
情報システム評価 → 総合評価 = 機能 + 信頼 + 使用 + 効率 + 保守 + 移植 + 保全 + 安全
信頼性向上技術: ハードウェア多重化 + ソフトウェア対処

フェイルソフト fail soft: システム故障時に性能低下しても運転続行す
フェイルセーフ fail safe: 性能低下させず処理続行する
フォールトトレラント fault tolerant: 障害に対し常にシステム稼働状態を維持する
ソフトウェア = 欠陥・誤りを開発プロセス中で除去 + 影響最小限に抑え、欠陥見つける

情報システムでは、プログラム正常動作だけでなく性能が問われる。システム設計段階から、性能考慮し設計を行うことも必要である。情報システム信頼性を高めるには、同一仕様に基づき複数プログラムを作成し、同じ入力データに対し各プログラムが同じ出力結果となるかを確認する等を行う
人間がデータ入力すると、誤入力避けられない。対し、チェックディジットを付加し、ソフトウェアで誤データ入力をチェックするのも信頼性高める一つの方法
Q 流通業、医療、エネルギー、建築等の分野での情報化システムをあげ、特徴と技術を調べよ。
明日の情報社会

soho
図3.1 在宅勤務 - 自宅と会社のコンピュータの接続

自宅会社間データ情報通信(Ex. テレビ会議・Eメール) → 在宅・SOHO (small office home office)勤務形態 = 情報化は仕事形態をも変えた
MFP (multifunction perpheral): FAX、コピー、プリンタ、スキャナを1つにした機械。合州国でSOHO向けビジネス機器とし注目される
コンピュータ内蔵家電製品同士が高度化相互通信し新生活スタイル生じる。音声理解し動作する電子ペットが作られ、躾方により電子ペットの性格が形作られる。電子ペットは大量生産だが、コンピュータ技術により持主の性格等に左右され電子ペットが個性をもつかも知れない
情報社会は、時間場所を越えコミュニケーションでき、チャット等では未知の人同士で対話できる。同じ趣味思想を持つ人達を容易に探せ、仮想的コミュニティを簡単に構成でき、将来は、バーチャル世界、バーチャルコミュニティが広がるだろう (Ex. バーチャル学校・親子・恋人)。CU-SeeMeというInternet電子会議システムは、「リフレクタ」と呼ぶnetwork上の下層電子会議室に接続し、互いの顔を見て音声で会議を行える
仮想現実: コンピュータ + センサー → リアル仮想現実を体験
飛行機パイロット訓練

コックピット窓にコンピュータディスプレイはめ込み、パイロット操縦により表示が刻々と変わる装置を用い飛行機に乗らず飛行体験可能
→ 体の動きをコンピュータ入力: 頭に仮想的視野を映し出すコンピュータ画面表示装置 + 体にセンサー

バーチャル旅行

自宅で世界旅行 + 旅行中にコンピュータ合成画面上の人物と会話
体が不自由な人も、遠隔地にいる人同士も、仮想的に一緒に旅行可能

バーチャルスポーツ

遠隔地でも夜でも実施可, バーチャル商店、遊園地、デート等も可

リモート手術

通信回線により病院同士を結ぶ – 既に行われている

Q 身近な仮想的コミュニティと、インターネットコミュニティを調べよ
Q 1) 仮想現実可能性についてブレインストーミングしアイデアを出せ。実現した場合、生活や産業はどう変化するか? 2) 仮想現実により、障害者、老人等の生活はどのようになるか
コンピュータは万能ではない!
しかし、個性をもち人格(?)を持つことになるかも知れない
コンピュータは、一般製品(家電・日用品等)同様、工場生産出荷製品だが、一般製品とコンピュータには利用目的の決定的相違がある。電子レンジは食品解凍・調理、乗物は物質輸送、と利用目的前提に作る。コンピュータは、多目的汎用利用を前提に、部品(ハードウェアhardware)やプログラム(ソフトウェアsoftware)が組換えられ万能機械といわれる(しかし、プログラミング可能問題にしか対応できない)

プログラミング: プログラマがコンピュータ指示命令手順の記述作業

→ 人間が逐次考えた手順に従い、プログラミング実行
→ 人間が考えられない問題は、プログラミング不可能

Ex. プログラミング不可能問題: 停止問題(あるプログラムが有限時間内に停止するかどうかを判別する問題)
コンピュータは、創造力はないがヒトの創造力を刺激し高めることは可能である。コンピュータ対話を通じ新原理発見・発明が期待される。4色問題はコンピュータが解き、囲碁は人間が勝てない。理論的にプログラミングできても非実用的問題にも対応できない。巡回外交販売問題(指定都市を外交販売人が1回ずつ訪問する最短経路を求める問題)がある。囲碁等の最終的結果到達まで試行錯誤を繰り返し解法を探す手順、即ち発見的(ヒューリステック)問題にも万能ではない。「2001年宇宙の旅」のHALは、先の話
個性・思想・性格がコンピュータデータ入力できれば、自分に似た思考のコンピュータができる。そのコンピュータと対談すると私は私と対談していると感じるだろう。私が死んでも、周囲の人はコンピュータを通じ私がいないことを意識しないかもしれないが、それでは私は死亡したのだろうか? 情報社会構築には、コンピュータや情報処理技術を恐れないために、正しい認識を持つことが必要である。システム作成時に、技術的問題だけによる判断でなく、生活や社会や環境に与える影響も考慮する
人工生命 artificial life, A-life, AL

Ex. ボイド boid: 鳥モドキ birdoid の略 – 鳥の群れ飛翔シュミレータ

Q コンピュータが人に近づくために必要な技術を調べ、実現可能性を考察せよ

表. 人間の頭脳作業とコンピュータとの比較
人間の頭脳 ___________ コンピュータ
計算といった情報処理 ____ 実現
情報加工 _____________ 実現
意思決定判断 _________ 補助手段として一部実現
感情処理 _____________ 実現していない

コンピュータによる頭脳労働外部化は、部分に留まり頭脳全て外部化できるかは未詳である。人工知能 artificial intelligence (AI)分野は、新原理コンピュータ開発を含め、人知性感情分野まで研究され、人間を幅広く解明する必要から、理系文系という枠組を超え共同研究が行なわれている
サイバネティックス(人工頭脳学) cybernetics: (電算機等利用)自動制御 cybernation

ネット情報を取り出す (extracting net information)


インターネットは、世界中のコンピュータを機器やケーブルで繋ぐが、電話網同様、繋がり方を知らなくても相手コンピュータ名(電話番号に相当)だけ知れば自由にやりとり可能(図1.1)
Q「葉書」「新聞」「掲示板」の機能差、利点欠点を考えよ。「コンピュータ上」にあったら利点欠点の変化を考えよ

internet
図1.1 インターネット

インターネット接続コンピュータからe-mailやNNを読み情報取り出せる。ワールドワイドウェブ(WWW, W³, Web)と呼ぶ「掲示板」から情報を取り出す
インターネット The internet: W³サーバ相互通信し情報交換可能にしたもの。The がつき大文字で始まる
WWW (Wold Wide Web), W³: インターネット上でWebページ単位で情報をやりとりする仕組
W³は1994年頃から普及し、Webブラウザはインターネットを通じWebサーバ接続し情報を取り出す

Ex. テレビ(TV)放送: サーバ = 放送局(情報源) → ブラウザ = TV(情報受信手段)
TVは送信範囲に制限があるが、W³は全世界中のサーバ情報を受け取れ混信もない。Webページは、テキスト情報に加え音声動画等の各種形態情報使用可能なためW³はマルチメディアシステムとも言う。W³は、「全世界に広がる蜘蛛の巣」で、ページが網目状にリンクしたハイパーテキストマルチメディア情報システムである

(Web)サーバ server: 情報発信プログラムとそのコンピュータ(Webページ管理コンピュータ)
(Web)サイト site: W³ページ管理場所
(Web)ブラウザ browser: 情報を見るプログラム → (Web)ページ page: 受け取る情報の単位 テキスト(情報): 文字の並びで表わされる情報
マルチメディア情報: 音声画像動画等、文字以外のものが混ざった情報
リンク link: W³サーバ参照指示書式 – ある情報中に他情報のありかを埋め込んであるもの
ハイパーテキスト hypertext: 多数情報をリンクで相互関連したもの。マルチメディア情報中心ならハイパーメディア hypermedia 情報と呼ぶこともある
プラグイン plug-in: ブラウザにマルチメディア情報を表示しする機能を追加するソフトウェア群。Ex. Shockwave
W³で情報を見る
コンピュータでWebブラウザ起動 → 設定された初期画面を表示

露崎史朗
https://____hosho.ees.hokudai.ac.jp/_tsuyu/index-j.html
プロトコル_サーバ________________パス___________
(媒体)________________________________________
⇑ Webブラウザで表示された最初のページ
図1.7 URL構造。「露崎史朗」のページ

表示ページ中に下線つきや違う色の文字等による表示箇所にマウスカーソルを持っていくと、画面下端にリンク先「番地」が表れる。リンク選択すると、ブラウザ画面が切り替わり指定番地ページが表示される。リンク選択操作はブラウザにより違う。W³はリンクと各種ボタン選択で情報を辿れる
ブラウザ表示起点ページを入口/ウェルカム/ホームページ等と呼ぶ → HPは、プレゼン全体・W³全体で、1 Webページ等は指ささない。ブラウザ参照を何でも「ホームページ」と呼ぶ人がいるが、誤解や行き違いがないよう注意
ホームページ homepage, HP: 「起点」は

(1) ブラウザスタートアップページ, (2) サイト入口ページ, (3) プレゼン入口ページ等いろいろある

URL (Webページの番地)
W³が扱うネットワーク中のもの(Webページ・音・画像等)に全てURL (uniform resource locator)形式の「番地」がつく(図1.7)。「http:」に続く部分がWebサーバ取り寄せページを表す。メール宛先や電子ニュース記事番号を表すURLはこの部分が異なる。URLは「番地」を3成分で統一的に書き表す(図1.7)。「//」から「/」間は、Webサーバ名、残りはサーバ中の情報格納位置である。情報伝達に幾つも方法があるため、それらを統一し書き表している
電話番号、「番地」では、葉書・名詞・電話帳等で相手に伝えないと役に立たず、相手電話番号を知れば使えるのと似て、閲覧ページURLを伝えるため、広告を出したり、別ページからのリンク等の「伝達」が行われる
情報検索と集合演算
ディレクトリサービスと検索サービス
ネットサーフィン: マウス操作だけで次々にW³を閲覧すること

ポータルサイトportal site: サーフィン起点を想定し作られたウェブサイト = ニュース等ユーザ関心度の高い情報 → ユーザの興味を持つ部分へリンクを辿れる Ex. Yahoo!, Netscape (s.l.)
→ リンクを辿るのは情報を眺める(ブラウズ)よい方法だが探索に不向き

探索は、ディレクトリサービス検索サービスがある。ディレクトリ(登録簿)サービスは、Webページを情報種類毎に分類整理し示すサービスである。情報全体を、大分類から小分類にし絞り込める構造をW³ページリンク上に用意し(図1.8)、分類に沿いリンク選択すると目的ページに辿りつける
ディレクトリサービス: W³情報を項目毎に分類整理し探せるようにページとリンクを構成しているもの

________________________________↓ 全体
_______________________科学・技術 ↓ 趣味 | 経済・社会
___________________医療技術 | 芸術 ↓ スポーツ
スポーツ医学 | スタジアムデザイン | 野球 | サッカー
図1.8 ディレクトリサービス例 (1998年サッカーワールドカップ情報)

無料HP検索用W³サーバ: サーバサービス提供元は営利企業だが、サーバ利用者から料金を取るのではなく、ページ広告で利益上げる

ディレクトリサービスは情報が分類整理され、その分類に沿い探し必要情報に到達できる。ページ登録場所は人が判断するため、無意味な情報に到達することは少ないが、登録ページしか探せないのが弱点である。情報分類方法は1通りでなく、「スポーツ医学」は「スポーツ」「医学」両方から辿れる。百科辞典と違いW³は頁を複数視点で分類可能だが全ては用意できない。ディレクトリサービスは頻度の高い分類法の枠組で分類する(サービス提供元により分類仕様違う)。慣れた分類法と違うと、探すのに時間がかかる 特定情報を効率よく探すもう1手段は検索サービスである。検索サービスは、分類を辿る代わりにWebページ入力欄に、直接検索単語(キーワードkeyword)を打ち込むと、指定単語が含まれるページを探す。単語追加し2単語以上をを共に含むページ等を探すこともできる。条件を厳しくすれば、ページ数も減り、試して行くうちに目的ページを見つける可能性が高くなる(図1.9)。これを絞り込み検索と呼ぶ
検索サービス(エンジン): 適したページを検索するW³サービス Ex. Google

検索#1: サッカー → 検索
検索#2 (検索条件追加): サッカー|1998 → 検索 ("サッカー"と"1998"の集合の積集合を求めている)

検索サービスは、単語を打ち込めば関係ページが探せ、絞り込みも簡単な利点がある。普通はWebページを探索ロボットプログラムで自動情報収集し、未登録ページも調べられるため、ページ範囲がディレクトリサービスより多い反面、検索ページが多すぎ必要なものが埋もれ、内容と無関係なページが検索される弱点を持つ 現在、ディレクトリサービスと検索サービスの違いは凡その区分で、多くのサービスは両機能を備える。ページを載せるのに探索ロボットでページ収集する、といった違いも固定的なものではない
Q 事柄を紙に書き、ディレクトリサービスで検索せよ。ルート記録をとり、分類法に違和感があれば原因も考えよ。次に、検索サービスで、絞り込み検索をし、各段階で、条件と検索数、含まれるゴミページの癖も記録する

W³とコミニュケーション

メディアと表現
メディア(通信)媒体) media: 情報伝達手段

マスメディア(大衆メディア) massmedia: 多人数対象のメディア

表現 expression: メディアが運ぶ物理的なもの。新聞紙面、テレビ画像・音(音声)、見ぶり手ぶり、表情等
ネットワーク通信技術ではケーブル等情報伝達材質を「通信媒体(メディア)」と呼ぶ。「メディア」と呼ぶ場合、より広い意味を持ち、マスメディアや、お喋り、電話、手紙等、人と人が情報をやりとりするもの全てが含まる
表現はメディアが情報伝達するための道具と言える。これと比べ、情報の送手が伝達したいと思う事柄そのものを意図と呼ぶ。メディアには個々に固有の制約や限界があり、情報の受手に意図を完全に伝達することは原理的に不可能である。換言すれば、普通は、送手の意図と受手が受取った意図との間に不一致が存在する(図1.10)、不一致の現われ方はメディア種別により違う

network
図1.10 メディアと表現の関係

Q A群情報をB群メディアで伝える場合、個々の適否と理由を表にせよ。[A群] 自作メロディ、自作絵画、自作小説、クロスワードパズル答。[B群] 電話、写真、カセットテープ、ガラス越しの身ぶり、葉書
情報伝達と評価
通常、発信者意図はW³ページ(少なくとも入口ページ)に書かれる。広報ページならPR意図とすぐ分かる。自己表現目的ページは、ページ全体が「見て!」と語り掛ける。半面、業務作成、試作放置等、意図不明ページもある。結局、意図不明ページは(自分に)有用な情報を得るページではない
1対1メディアは、疑問点を質問する等、やり取りし送手の意図と受手の理解との不一致を狭める。マスメディアには、その様な手段が少ない。送手が送ったものが事実を反映しているかは、表現だけでは分からない。送手はワザと偏った情報を送り受手を自分に都合のよい様に操作することすらある(情報操作)
情報操作やその他異常情報防御のため、
  1. 複数メディア情報比較
  2. 日常個々のメディア特性に注意(「あの情報は信用できる」「この新聞はセンセーショナル傾向がある」)
等、自己評価できることが大切である
送手が嘘をついているとは限らない。複数の正しい情報中から、送手にとって都合の悪い情報を伝えず、都合のよい情報だけを伝えるというのは、情報操作の古典的手法である
Q 普段良く見るページの意図を書き出せ。意図は明確か。またそれはなぜか
Q 新聞を集め、共通記事を探し、内容や表現(見出し)の違いを比較せよ
W³における情報伝達
一般のメディアと異なる特性について
W3 = 強力なメディア ⇔ 大きな危険
• 基本的に発信者から受信者(複数)へ1対多・一方通行 - マスメディアに類似
• W³は情報発信者が自由にコンテンツ作成 - 1対1メディアに類似
• W³情報発信は、低コストで瞬時にアクセス可能になり、ほぼ検閲は無力

従来マスメディア: 編集者・プロデューサが発信前に情報整理しチェック。誤情報や社会的問題のある情報が流されれば読者が気づき問題点を正す社会的圧力が働く
⇔ W³情報は1人だけで発信可能 → チェックは発信者1人の中でだけ働く

→ 発信者の情報操作は止められない。対策(唯一) = 情報受信者が危険性を理解して情報使用法を決める
誰かが問題に気づいても、訂正させるのは難しい。発信者に忠告しても無視されれば、他に取れる手段はない。世界中のユーザマシンにこのWebページは注意しろとポストイットを貼るのは不可能である
情報の正しさを読み取る
意図の明確さと情報の正確さは別問題である。あるページ情報の正確さを判断する方法を挙げて見る
情報取材の基本として、情報がその通りであることを、他の手段でも確認する(裏を取る)。別Webページ、新聞、雑誌を調べる、情報源に直接確認する等が考えられる
作者を知っていて、信頼できる人と思うなら情報を信用する根拠だが、別人が偽装している可能性もある
自分の経験や考えに照らし、ページ情報が正しそうかを判断する。ただし、「自分にとって好ましい情報だけを信用する」事態に陥らないよう気をねばならない
Q Webページ公開し、見た人が自分の意図通り見ているか調べる方法を考よ
Q 取り上げたページから幾つか選び、各々正しさを確認せよ。「自分の考え」は当てになったか
W³で発信者の要求に応える
発信者は、ページ訪問者の反応を知る時や、積極的に意見収集目的に情報発信することもある。W³ではフォーム form と呼ぶ、アンケート形式で情報受手が発信者に情報を返す「記入用紙」機能がある。フォームに、記入欄等の「部品」が並び、回答を設定し提出ボタン(「提出」「送信」等)を押すと、記入内容が発信者に転送される。フォームは、一方通行だったW3を発信者受信者相互交信可能なものに変えた
フォーム等に現われる典型的「部品」には、次のようなものがある
  • 押ボタン: 選択すると動作(フォーム提出や記入内容初期化等)する
  • チェックボックス: ☑(Yes/No)をつけ外しできる
  • ラジオボタン: N個のボタン中の1つが常に選択状態 - 1つを選択する
  • 選択メニュー: ≈ ラジオボタン + 選択項目が並ぶメニュー
  • 記入欄: 枠内に、文字を自由記入し提出できる

ネットワークとプロトコル


ネットワーク network

= 電子情報ネットワーク又はコンピュータネットワーク
複数コンピュータシステムが相互に自律的に情報通信できるよう構成されたシステム(ハードウェアとソフトウェア複合体)
ブラウザであるページを開くと、手元のコンピュータはそのページ情報をサーバから拾うが、キャッシュが残っていれば取り寄せを省略できる。どちらにするかは、手元のコンピュータ内部で自律的に判断している
自律的 コンピュータが、情報のやりとりを他コンピュータに指示されることなく独自に決定し実行すること
Q 「ネットワーク」と呼ばれるものを挙げ、共通点や相違点を表に整理せよ

ネットワーク通信路

通信路 communication path: 情報伝達に必要

Ex. 通信媒体: 電話は銅線、携帯電話は(基地局まで)電波

コンピュータ間通信: 媒体は光ファイバー(昔は銅線)が普通

その上での伝送方式様々 → ケーブル規格(本数, 配線)繋がり方異なる

コンピュータ使用伝送方式は、全て0/1から成る情報を伝えるデジタル伝送という点が、アナログ放送(テレビ・ラジオ等)と比べた違いとなる。1通信路が、何種類かの通信媒体や伝送方式を組合せ構成されることもあり、通信媒体や伝送方式が切り替え場所に中継装置が必要になる
Q 使用コンピュータシステムに直接間接につながる通信路を調べ、接続様式を推定してから調べよ
パケット packet: LAN内でやりとりするひと固まりのデータ
OSIモデル: ネットワーク階層モデル。レイヤ1-7までが定義される(表)
TCP, transmission control protocol: 伝送制御プロトコル。OSIモデルでトランスポート層プロトコル。パケット到着順序通りの並べ替えやエラー修正等は行われTCPより上から見た時は2台のコンピュータが信頼性の高い専用線で結ばれている感じ
TCP/IP, Transmission Control Protocol/Internet Protocol: インターネット標準通信プロトコル
TCP/IPスタック: PCプラットフォームのみ必要。PCインターネット接続は、TCP/IPスタック、ソケットソフトウェアwinsock.DLL、ハードウェアドライバソフトウェア(パケットドライバ)必要
ソケットsocketは、BSDで普及した機構で、通信線終端を表すプロセス間通信機能の一種。ネットワークを使うプログラムを書く時は、あるマシンのソケットと別マシンのソケットとの間でデータをやりとりすると考えソケットシステムコールsocketを使えばよい。UNIXに殆ど移植実装

Winsock, Windows Sockets: TCP/IPアプリケーション開発プログラム標準仕様のソケット
Winsock.DLL: TCP/IPアプリケーションにインターネットとの接続機能を提供するライブラリルーチンの集まり

イーサネット ethernet 伝送方式: 中心にハブ(スイッチ)機器を置き、そこと各コンピュータ間をより線対(2本の銅線をより合わせたもので電話線配線も使用)で接続し全コンピュータ相互通信する方式
DEC, Intel, Xerox共同開発(頭文字, DIX仕様)で1980年製品化したバス構造LAN(元々、X社研究開発用データ交換技術名称)。イーサネットはver.1, 2, ver.2と若干異なるIEEE802委員会作成CSMA/CD (carrier sense multiple access/collision detection)型LAN(IEEE802.3)がある。伝送媒体に50Ω同軸ケーブル使用、バス制御はCSMA/CD方式で最大伝送速度10Mbit/sec、ノード間最大長1 km、最大ノード数1024である。イーサネットは1伝送路を全利用者が共有し、送信はバス空きまで待つ衝突回避のため、バスが空くと同時に複数利用者が送信し衝突する可能性があり、各利用者は時間を置きデータ再送する。仕様はIEEE802.3規格化され、ケーブルから10BASE5 (thick), Cheapernet (10BASE2, thin), 10BASE-T (unshield twist-pair), 100BASE-TX, 1000BASE-x, 10GBASE-x他がある
ithernet
ブリッジ bridge: LAN内で同一MACプロトコルを使うセグメントとセグメントを(回線経由で)接続する装置

MACアドレスを調べ別のセグメントのパケットだけを通過させる。伝送路を直接接続するローカルブリッジと、ISDN等の回線を経由し遠隔地のLAN同士を接続するリモートブリッジがある

ブルータ brouter: ブリッジとルータ両方の機能を持つLAN間接続機器

Ex. ブルータがIP対応 → TCP/IPに基づくデータにルーティングし、IPX/SPXデータに対しブリッジとし働く

ブロードキャスト broad cast: LAN内での一斉同報。1データを複数マシンに送るためLAN内トラフィック増える

ブロードキャストストーム: パケット極端増 - 正常データ送受信不可
コリジョン collision: LAN内流れるデータ衝突。NICやMPTは、発生示すコリジョンランプ付けることも多。ブロードキャストストーム等の時に発生

100Mbit/sec仕様に100 BASE-T (既存方式継承)、100VG-AnyLAN (非互換)の2方式が標準化された。96年、Gbit/sクラス伝送速度の「ギガビット・イーサネット」標準化が始まり、100 Mbit/sイーサネットバックボーンとし利用する。96.5実現に向け11社が集まり「Gigabit Ethernet Alliance」が発足した。GBイーサネットは光ファイバやTwinax銅線の仕様を標準化し、カテゴリ5のUTPケーブル利用の規格標準化作業を始めた
FDDI, fiber distribution data interface: 光ケーブル使用トークンリング方式LAN。転送速度は100Mbpsと速い

トークンは更新許可証の意味で、リンク内流れるトークン情報を捕まえたコンピュータのみに送信権持たせ、衝突なしの回線共同利用を実現。主にethernet同士をつなぐ幹線(バックボーン)とし使用

RPC, remote procedure call: 手元マシン実行プログラムからネットワーク上マシンのプログラムを利用する機構

OSF提唱のDCE中核要素の1つで、呼出し側は、呼出し先が結果を返すまで処理を中断する同期型連携である。RPC別な連携方法にメッセージ連携があり、結果を返ってくるのを待たない非同期連携である

レプリケーションreplicationは、ネットワーク上DB複製replicaに対し、更新内容を自動的に伝播する仕組みで、複数DBサーバ間でデータをやりとりし、DBの一貫性を保てる。マスターと、レプリカは同形式テーブルである必要なく、レプリカ側更新はマスターと同時の必要もない(非同期更新)
NDIS, network driver interface specification: Microsoftが定めたLANマネージャのデータリンク層-LAN接続ボード(NIC)間通信定義用インタフェース。NetWareは同インタフェースをODI(open datalink interface)とし規定
DHCP, dynamic hosts configuration protocol: DHCP使用マシンにDHCPサーバが自動的にIPアドレスを割り当てユーザが細かくネットワーク設定(ホスト名・IP, ゲートウェイ, DNSサーバーアドレス・サブネットマスク)せず接続・利用 → IPアドレス固定静的割付方法(従来接続)よりIPアドレス有効活用可。常時接続ホストに向かないが、ノートPC等ではDHCPサービス利用すべき。ただし、DHCP接続は接続毎に割り当てられるIPアドレスとホスト名異なる Ex. Win: 「TCP/IPのプロパティ」→ 「IPアドレスを自動的に取得」だけ
ARP, Address Resolution Protocol: IPアドレス → MACアドレス調べる
RARP, Reverse ARP: MACアドレス → IPアドレス調べる

LANとWAN

ローカルエリアネットワーク local area network , LAN: 1組織内部で局所的ネットワークを構成したもの
規模 = 1部屋-1キャンパス全体位 → コンピュータ間距離近く高速通信可
  1. プリンタ・ハードディスク等の装置を複数コンピュータ共有利用
  2. 大量計算等を未使用コンピュータに転送実行
  3. コンピュータや入出力装置故障時に他装置を使い作業をこなす
等の利点から利用
広域ネットワーク (WAN): LANより広範囲ネットワーク → LANより低速

遠距離通信手段や共同作業に利用
Ex. 大学複数キャンパスや企業複数事業所を結ぶ, 同一目的を持つ組織が相互接続, 通信事業者が構築

ルータ router: LAN環境で異なるセグメント間をネットワーク層で相互接続する装置
ネットワーク層レベルを見るためデータリンクが異なるLAN同士でもデータ交換できる。IP(internet protocol)アドレスのようなネットワークアドレス識別を行うため、最適経路選択を行うほか、指定IPアドレスをもつパケットのみを指定された相手先に伝送し、セキュリティ管理やあるセグメントでのトラブルの波及防止が可能となる
Q WANは、遠隔コンピュータ接続利用できる(仮想端末サービス)。遠所コンピュータ使用理由を列挙せよ

インターネット (ネット, internet, net)

1970年代(米国): ARPANETと呼ぶネットワーク

機能
1) 情報転送経路障害時も障害回避し別転送経路に自動切替え
2) 大データを分割発信し受信側で元データに復元
→ 大学・研究施設等に広まり改良

1983年頃: APRANETで多大学間接続したのがインターネットの始まり

ARPANET開発技術 → ネットワーク間が直接は未接続でも幾つかのネットワークを介し通信可能
→ 全マシンが相互通信でき「世界にまたがるネットワーク」または「ネットワーク集合体」形成

接続された個々のコンピュータやネットワークは刻々変化し、ネット全体の管理者は存在せず、単一管理組織もない(internet network共通規約・技術検討組織は存在)。各ネットワークやコンピュータは、プロバイダに管理される。ネット利用には、個人・法人がインターネットプロバイダ(ネットワーク接続企業)と契約やネットワークプロジェクト(研究教育等目的共同資金出資しネットワーク維持)に参加する。プロバイダやプロジェクトの規約に従う必要がある。プロバイダは、ユーザに快適なネットワーク通信環境を提供するため、サービス内容やレベルが異なり、他社とのサービス競争に優位に立つため努力し、ユーザがそれを評価し、ネット通信品質が保たれる
(サービス)プロバイダ (service) provider, IPS internet service provider: Internet接続通信回線を提供する業者
Internetサービス利用にはTCP/IPプロトコルを用いInternet回線へ接続する。接続方法に直接ネットをつなぐ専用線接続と、電話回線経由によるダイヤルアップIP接続の2通りあり、普通業者は両方を手がける

通信プロトコル(規約)

通信規約(通信プロトコル): ネットで正確に情報を伝えるための取り決め
「サーバ同士がネット接続されても、情報形式が異なると情報交流は出来ない問題」回避に、NICが管理流通するRFC規約がある。ネット情報流通にはRFC規約に基づく使用の必要がある(図1.13)。現在、殆どのコンピュータがRFCに従い通信し、W³もRFCやRFC指定の他規約文書等で、特定サーバを選び情報収集する方法、情報蓄積する場合の形式・文法等が定められている。ネットワーク初期には、研究施設・コンピュータメーカが独自規約ネットワークを作り、異なるメーカのコンピュータ同士の接続が困難であった

Request For Comments (RFC)

• Locate online RFC by number, title, or author
• Current protocol Standards (STD 1)
RFC Sources (with search capability):
• Information Sciences Institute (from US).
Search by number, title or keyword. Has a list with all RFC's with links by RFC number. Also serearch by category.
Note: PostScript files are ‘available’ WWW via anonumous ftp …

図1.13 RFC内容


プロトコル階層
通信プロトコルは、複数階層に分かれる。ケーブル間接続には、コネクタ形規格や信号signal電流電圧規格決める。別に、情報送受信規格や、W³やEメールではURLやメールアドレス指定方法規格が必要である。これらを一緒に扱うのは無理なため、プロトコル全体を複数レベルに分け(プロトコル階層)扱う。プロトコル階層構造をコミニュケーションに当てはめると(図1.14)、AさんがBさんに情報を伝えるのが、最上位階層(思考層)で、次に、情報伝達を日本語で行なう(言語層)が、相手に伝えるには口に出し喋る必要があり(伝達層)、喋った言葉は空気振動になり相手に伝わる(物理層)。上位プロトコルが使える限り、下位プロトコル群を替えても同じように通信ができる。例えば、英語でもよく、音が伝わらない時は紙に文字を書き示せば同じことが伝わる。通信プロトコルも同様に、上位プロトコルが同じなら下位プロトコル(通信媒体等)を取り替えても正常通信できる

network
図1.14 プロトコルの階層性

Well-known Port: 主要プロトコル使用ポート番号を定め、サービス同士を接続しやすくするためRFCが定めたポート番号 (Ex. HTTPは80, SMTPは25)
状態遷移: プロトコル理解上で訳立つもう1つの概念
電話を掛けるには、電話器を取り、ダイヤルしベルが鳴り、相手が出るとつながる。話し終わり相手が受話器を置くと、他方は「切れた」状態になり断続音が出る。掛けた時に話し中の時も同じ音がする。どちらでも受話器を置くと、例えば、こちらが先に切れば最初に戻る(相手側に断続音が出るが、こちらには分からない)。状態遷移図で書くと理解し易くなる(図1.15)。状態遷移図は、個々の状態を□(又は○)で表し、どの場合にどの状態からどの状態に移るかを矢線で表す。最初どの状態にいるかは外から入って来る矢線で明示する。ネットワークプロトコルでも、どう通信を始め、どう通信を終えるかを状態遷移図で考えられる
最初の状態→[受話器取る]→発信者→[ダイアルする]→ベルが鳴る
       ↑                       ↓                        ↓
       │            [ダイアルした相手が話し中]   [相手が受話器取る]
       │                       ↓                        ↓
    こちらが  ←───────断続音←[相手受話器置く]←接続中
    受話器置く←─────────────────────┘

図1.15 状態遷移図

Q [1]赤青緑黄4色を使い平仮名の並びを伝達するプロトコルを設計せよ。[2]出題者が平仮名問題文を送信者に示し、送信者が赤青緑黄折紙を掲げ、受信者が離れた所でそれを見て原文を復元せよ。[3]音符を平仮名で書き表すプロトコルを設計せよ。[4]出題者が音符を示し、それを平仮名→色→平仮名→音符の順に変換し離れた所に音符情報を送ってみよ。[5]複数のチームに分かれ伝達の正確さと速さを競え
Q 1) 前問プロトコルを、カタカナも送れるよう直せ。(ヒント: どの文字でもない組合せを2つ用意し「これから片仮名状態」「これから平仮名状態」という状態切り替えを行う) 2) ビデオ録画予約の流れを状態遷移図で表せ

サーバとクライアント

プロトコル階層最上位に、個々のアプリケーション(AP)に対応した応用層がある。一般プログラムでは、APは個々に単独動作できるが、ネットワークを使うAPは、プログラム同士が通信するため共通プロトコルが必要である。応用層では概ね、1プロトコルが1情報サービス(EメールやW³等)に対応する
サーバ server: サービス提供のためコンピュータとその上で常時動作するプログラム Ex. Webサーバ
クライアント client: サーバと通信しサービス利用する利用者側コンピュータとプログラム。Ex. Webブラウザ

_________→転送要求→________________________→情報公開→_________
クライアント→情報公開→サーバ↔(インターネット)↔サーバ→転送要求→クライアント

サーバ同士はインターネット接続され、異なるサーバ利用クライアント間でも情報交換でき、利用者は自分の使うコンピュータに近い所のサーバを用い遠方とも情報交換できる。サーバ-クライアント通信は直接行なっているように見えるが、実際は何台もの機械による通信内容の中継・転送が行なわれる。中間経由機械の機能・性能考えなくても相手と直接通信しているように見える
Q 社会にもサーバ-クライアント関係が多数存在する。列挙せよ。Ex. 商店 = サーバ、顧客 = クライアント
クッキー(cookie, cookies): PCにサーバから「前回アクセス時刻」等、ブラウザ固有情報を保存する仕組
全アクセス情報のサーバ保存はサーバに負担がかかり、PCに保存し必要時に取り出せた方が便利である。クッキーは有効期限があり、サーバが「○○まで保存」とPCに記録し有効期限が切れれば自動削除する

セキュリティ security

ネットワーク上の漏洩・侵入・破壊・改変を未然に防ぐ対策
クラッキング: ネットワーク上で、情報が使用者の意図しない所まで配られたり、他人のコンピュータに侵入し情報を盗み出したり、コンピュータ上の情報を破壊する(犯罪)行為

→ ネットワーク情報中継中に改変される等、情報の信頼性に問題生じる

CUG, closed user group: network内アクセス可能ユーザを限定した部分
VPN, virtual private network: internetを企業内専用線ネットワークの様に運用する方法。通常、fireWallやPPTPを使用し、外部アクセスをガードしセキュリティ強化
ファイアウォール firewall: ファイアウォール内側コンピュータをCUGとするネットワーク構成方法で、ハード・ソフト両方用い構築。内外間に境界形成し、内部アクセスに安全なサブネットを形成し外部アクセスを遮断し資源共有する。ファイアウォール頂上1台(top)が内外両方にアクセスするよう設定し、topはインターネットと直接通信を行うので外部不正アクセスに対し厳重なセキュリティ処置必要である。不正侵入の危険を減らす反面、外部情報アクセス制限されたり、特別なソフトウェアが必要となる。ファイアウォール内外部両側から情報をアクセスできるようプロクシ(とSOCKS又はその一方)を使用し設定
プロキシとソックスSOCKSは内からインターネットアクセスを可能にする
プロキシ(代理) proxyサーバは、ファイアウォールソフトウェアと共に実行される。クライアント-サーバ間に入り、クライアントの代わりに要求出し、サーバの代わりに返答する。ネットワーク遮断タイプのファイアウォール上で稼働させ、ファイアウォールを跨ぐ通信が可能となる。Telnet、FTP等、サービス毎に固有プロキシがある。プロキシは、キャッシュ機構、ログ機構、アクセス制御機構等の面でSOCKSより優れる。SOCKSソフトウェアは、ファイアウォール上か内部サーバに導入する。内は、インターネットアクセスにクライアントとしてSOCKSサーバにアクセスする。Macintosh, UNIXではプロクシパネルでSOCKSホスト(サーバ)名とポート番号を、WindowsはSOCKSホストをINIファイルに [Services] SOCKS_Server=mysocks.domain.comと指定する
Q 大声出さず隣室の人との会話方法を考え、問題点を予想せよ。隣の建物にいる人との会話では?
SMTP, simple mail transfer protocol (RFC821): インターネット標準メール転送プロトコル。メールサーバ間メール転送、クライアントからサーバにメールを送る際等に使用
MTA, message transfer agent(メイル転送プログラム): ホスト間メール転送(リモート配送)を受け持ち、メールをmailboxに配送(ローカル配送)する。転送プログラム起動もする
リモート転送: メール表書通りに配送(返送)する。宛先ドメイン部からDomain Name Server (DNS)のMXレコードを検索し宛先(送先)ホスト決定し送先ホストとの接続手順にSMTPを使い配送する
MUA, mail user agentメイラ: 利用者がメール読み書きに使う。mailboxに配られたメールを読み出し、書く手助け、MTAに渡したりする。mailboxを直接読むのではなくPOPやIMAPプロトコル使いリモートのメイルサーバ上のmailboxを読むMUAもある
mailbox: 受信メイルのMTAによるローカル保存場所。mbox形式、maildir形式等がある
Mbox: メイル0個以上含むファイル。メール配送中クラッシュ等で信頼性低。mboxファイルやmhフォルダではメッセージ契れ次メッセージとつながりMTAは再送を試みるが破壊メッセージが表示される。プログラムが使うロック方式が違うとファイルは破壊される。多くのサイトがSun NFS (Network Failure System)以外ないため使っているがNFSにより問題悪化し、信頼できるロックがない。2マシンで同じユーザ宛メイルを配ろうとしたり、メイル配送を受け持つマシン以外で利用者がメイルを読むと利用者メイルが失われる危険がある
Maildir: メイル受信用ディレクトリ構造

信頼性:

  1. 個々のメッセージは配送終了時点で処理終了し他と独立
  2. 配送プロセス毎に異なるファイルを使いロック不要
  3. 配送メッセージはメイルリーダが書き換えても削除しても安全
  4. NFSでも問題なく動く
ポストオフィスPostOffice: 例えれば電子メール上の郵便局で、配信時、一時的にmail保存し、使用するメンバ管理等行う。大規模なmailになると複数になりPostOffice間をMTAによる中継が必要

電子情報ネットワークへの参加


コンピュータによる情報取り扱いでも、通常テキスト情報が多い。W³は画像・動画・音等様々な情報を含められるが、情報伝達方法はテキスト情報が中心となる。テキストの弱点は、構造が1次元で思考中は多事柄が網目状に繋がっていても「1つずつ順番に」書くことがある。情報技術は、その不自由さを減らす手段として有効で、W³ハイパーテキストは典型例である
Q 人の主要情報伝達手段の1つである発話(声に出して喋る事)とテキストを比較し、長所、短所を比較せよ
タッチタイピング: キーボード見ず「そらで」キーを打つこと

標準キーボードホームポジションは、左手「ASDF」右手「JKL;」に置く
60-100文字/分で打て筆記速度を凌駕する

コンピュータでテキスト扱う利点に自由に直せる点がある。例えば、任意の場所にテキストを挿入・削除できる。ある単位でテキスト移動できる意義は、「効率よく直せる」だけでなく、何度も校正行え文章を積極的に改良できる

software
図2.1 切取と貼付

ファイルに情報残す → [保存] 消えると困る内容は必ずファイル保存(図 2.3)
同一名ファイルに保存 = 上書き = 古いファイル消える → 重要情報に上書きしない (上書保存時は「OK?」等と注意を促すエディタもある)
ファイル file: コンピュータ中の情報に名前つけ保存したもの = ハードディスク等媒体に作成される論理的データ保管部分 = データをある規則に従い保存し、参照できるようにした1つのまとまり
メモ ファイル保存: エディタ側「ファイルに書き出す」 = ファイル側「ファイルに書き込む」。ファイル読み出し: ファイル側「読み出し」 = エディタ「読み込み」 → どちらの言い方もよく使う

software
図2.3 ファイルへの保存

エディタ
編集 → 「開く」

名入力/一覧から選択

保存 → 「名前をつけて保存」
元ファイル保存 → 「上書き保存」(名前指定不要)

重要ファイル上書きに注意

情報処理 = 整理手段重要
Ex. ファイル分類一覧を行なうプログラム → ディレクトリ: この分類単位のこと ディレクトリ中に更にディレクトリを置き階層構造分類も可(図 2.4)。ディレクトリを作成・削除、ファイルをディレクトリ間移動する等のプログラムが必要となる。システムにより、ディレクトリ操作プログラムとファイル一覧表示プログラムが一体になっている。エディタでのファイル読み書き機能に前記の機能が付属することもある

software
図2.4 ディレクトリの階層構造

片仮名だけならキーボードに直接割り当可能だが、漢字では、かな漢字変換が登場する。かな漢字変換は、単語の読みをローマ字等入力し、その読みを持つ漢字を探し変換するものである。使い易さは、「辞書」(FEP)との相性に左右される。よく使う単語が辞書未登録な場合、単語を辞書に追加登録できる テキスト検索: テキスト情報中から特定文字列が現われる箇所を探す
テキスト置換: テキスト情報中の特定文字列を、別の文字列で置き換える
置換: 一括置換と逐次置換があり、「影響が及ぶ」という意味の「及」は漢字、「AおよびB」は平仮名にしたければ置換を一気に行わず1箇所ずつチェックできる。目では、見落としや間違いが避けられないが、検索置換では心配が減り、単純繰り返し作業はコンピュータに適する

電子メール (Eメール, e-mail)

ネットワークを通じある人から別の人宛にメッセージを届ける情報サービス
概念: 電子情報ネットワーク上サービスで、古くからあるのが電子メール (Eメール, electronic mail, e-mail)である。Eメールは、電子的にメッセージを届ける情報サービスで「電子の葉書」と言える。情報を、コンピュータ利用者に知らせる仕組みで、その内容がEメール(「電子郵便」ではない)である。Eメール送受信に、利用者は「メアド(メールアドレス, e-mail address)」をつけ、手元のコンピュータからインターネット接続されたメールサーバに送る。メールサーバは、メール宛先を解釈し、受取人のメールサーバにメール転送する。受取人は自分のメールサーバにアクセスし自分宛メールを取り出す

mail
図2.5 ユーザーは自分のメールサーバを使い、メールサーバ同士は直接通信

e-mailは機能的に葉書と似るが、次の様な点が葉書より優れる
  • 遠隔地でも迅速にメッセージ伝達可
  • 1メッセージを多数宛に同時送信可
  • 様々なデータ送信に利用
Eメールは未着、中継点サーバ管理者閲覧可能性あり、封書書留より「葉書」的なので、隠すべき内容は暗号機能使い、返信を送る等の配慮を忘れない
S/MIME, secure multipurpose internet mail extentionはRSA Raboratories等策定MIME形式メール暗号化形式。本来128bit鍵使用だが、米国輸出規制で米国以外は40 bit鍵まで利用可。PGP, pretty good privacyはPhilip Zimmermann氏(1991, 米)が初版開発メール暗号化ソフトで、ソースコード印刷し、輸出規制解除し、海外でも「国際版」とし128bitフル規格を利用可
利用方法
利用者認証: 使用者をコンピュータに正しく識別させること
必ず始めにコンピュータに「使用者」を教える。典型的には1人1人が固有ユーザIDを持ち、他人が利用しないようパスワード password (PW)設定する。開始時にID/PW入力しコンピュータを使える状態にする
ユーザID: 認証のために使う、各人に割り当てた他の人と区別のつく名前

login: 利用者名 → Password: _________ → Welcome ...

どのEメール用クライアントでも、Eメール記事書式はRFCで決められ、原理的にはプロトコルに従うので同じある。クライアント起動すると、自分宛受信メッセージ一覧が表示される(未読だけ一覧表示のものもある)

04/01 taro@kou.ne.jp 学祭について
04/01 mika@kou.ne.jp Re: 学祭について
04/02 sense@kou.ne.jp 昨日の掃除

メッセージ毎に送信日付、メアド、主題が表示される。メアドは「利用者名@ドメインアドレス」となる(同メールサーバ利用者同士では利用者名のみ指定可)。ドメインアドレスはインターネット上で個々のコンピュータの特定名で、ここでは利用者がメール読み書きに使うメールサーバ実行コンピュータを表す。主題は送手がメッセージにつけたタイトルで、本文中の用件を示す
メッセージはヘッダ部分と本文に分かれる。「ヘッダ」は、Eメール宛先や表題、発信人、発信日時等の「Eメールの属性的情報」が書かれた部分である。「本体部分」は本文となる。ヘッダと本体部分は分割され表示される

メールアドレス(メアド), Eメール送信元宛先: RFC書式規約に従い書くだけ。メール受信時は送信メアドで送信者知り、メアドは個人特定に重要な役割

From (発信者): 差出人メアドを書く。通常「ログイン名」等からFrom内容を自動判断しe-mail・NN用ソフトがFromヘッダーを自動生成する

To (送信相手): 送信先明示ヘッダ。複数人宛同時送信でも送信者全員分かる

CC: 控え(写し, カーボンコピー, carboncopy)送信相手。昔のカーボンコピーで複製を残す習慣から。CCは、同内容を複数人に送れ、Eメールも採用。CCヘッダは、副宛先への送付を表すヘッダとなり、返信不要と考えてよい

Bcc, blind carbon copy: 非表示宛先、CC送信先隠す時に指定。BCC受取人名は、メッセージヘッダに非記録。BCCだけでメール送信はできない

Subject: 件名(表題)。Eメール・記事メッセージにつけた表題で、「必須」ではないがつけるべき。個人的E-mail受信者は件名に関係なく目を通すため表題は日常習慣ではないが、Eメール検索時に適切な件名があると便利である。NNは不特定多数を対象に発言するため、情報交換のために読んでもらうにはSubjectで中身が分かるようにすべき。Subject: questionでは中身が分からない。Subject: What is needed for living in England?なら、知識・興味を持つ人が目を通してくれそうである

Date: 発信年日時記録したヘッダ。普通タイムゾーン(TZ)記す。日本正午発信Eメールがロンドンに直ぐ届いても、現地はAM3:00で(夏時間+1 hr)、多分返事は日本の夕方以降。一方、正午にワシントンに送り直ぐ到着しても、現地は前日PM10:00で、やはり直ぐの返事は期待できない。Dateヘッダは、1) Date: Thu, 05 Mar 1998 00:32:27 +0900 (TZ+0900地域、Ex 日本発メール), 2) Date: Wed, 04 Mar 1998 09:46:19 –0600 (タイムゾーン-0600地域、Ex USAテキサス発Eメール), 3) Date: Wed, 04 Mar 1998 16:49:29 +0100 (タイムゾーン+0100地域、Ex フランス発Eメール)、の様に書かれる。最初のEメールが木曜日発信で、次の2通が水曜日発信のEメールだが、時間経過をタイムゾーンと日付変更線を含め考えれば、日本からのEメールが一番古い。国内タイムゾーンは、他にThu, 05 Mar 1998 00:32:27 GMT+0900, Thu, 05 Mar 1998 00:32:27 JST等の書き方がある

タイムゾーン: グリニッジ天文台南中時刻を正午とする「世界標準時GMT」に対し、各国・地域標準時の差を表したもの。日本はGMTに9時間加える] → 季節差に注意 (Ex. 北半球 = 夏 → 南半球 = 冬)

Message-ID: メッセージID。各メッセージ固有識別記号。表示や整理時にメッセージ指定するため使用

ID は「どのEメール・記事への返事かを識別する」役割果たし、各メッセージ固有でメッセージを曖昧なく指定できる。Eメールや記事へ返信・フォロー等を行なう時は、ヘッダ後に本文が表示される
Ex. <199802140922.SAA27599@wise19.abc.def.ghi.jk>がMessage-ID。Eメール転送時は、これらヘッダの他に、転送に必要なヘッダが付加され転送途中の中継点の記録も次々にヘッダに付加される

電子メール送信
送信先アドレスTo、主題Subject、本文を指定すればよい。クライアントによりCc:に自分を指定せずとも送信メール写しを自動保管する機能がある
誤送信!: 送信e-mailは取り戻せない。アドレス間違え送るとどうなるか?
1) 送信先アドレス無効: Fromが大抵Mailer-Daemon、表題User unknown/ Host unknown等のEメールがメールサーバから自動的に送られる。その内容からEメール配送失敗原因分かる。「User unknown」 = ドメイン部分正しいが利用者なし。「Host unknown」 = ドメイン部分違う。Ex. nishizawa@abc.def.ghi.jk宛Eメールは「利用者nishizawaなし(User unknown)」なためEメールが戻された
2) 送信先アドレス有効: 他人に送られ絶望。送信正常終了し気づかず、誤配相手から連絡あると判る。誤配先に謝りのメール送り、正しい宛先に送り直す
3) アドレスの一部を間違えた: 複数メールアドレスをToやCcに列挙し、一部に誤ったメールアドレスがあると面倒である。正常受信者が返事を書くと、大抵、元メールのTo, CcのメールアドレスがCcに付加され、それにも間違ったメールアドレスが含まれる。その間違ったメールアドレスが無効な場合、返事を書いた人にmailer-daemonからエラー通知が届き、間違ったメールアドレスが有効な場合には誤配となる。早く、To, Cc全員に訂正情報を流す
電子メールの返信・反応
受信Eメールへ返答・回答・意見・反論といった「反応」を行なう(リプライ、フォローアップ)際、「どのEメール・記事の」「どの部分に対する」反応かを示すべき。反応を読む人が使う電子メールクライアントソフトのために、ヘッダを使いMessage-IDを示し、更に、読む人のために参照・引用を行なうべき
返事もEメールとするのが普通である。「返信」機能使うと、自動で送先等設定され、元メッセージが引用される等、返信に便利な処理がなされる

「>」で始まる行は元のメッセージの引用部 → 不要箇所削除し必要箇所引用するのも大切

返信の約束ごと
Subject文字列先頭に"Re:"つけ、元メッセージへの応答を表す慣習がある
返答Subjectは、「Subject: Re: xxxx」とする。返信が元表題から外れた内容になるなら「Subject: yyyy (Re: xxxx)」等としておくと読む人に親切である
メモ: 返信主題を元主題前に英語ビジネスレター慣習由来のRe:「について」をつける(辞書!)。「Re:」をreply, response省略形と勘違いしたり、「レス」と略すと、話が通じない
メッセージ整理
メッセージは整理しないと、探す時に苦労する。電子メールクライアントには、メッセージをメールボックス(フォルダ)に分け保管する機能がある

mail
図2.8 メールボックス/フォルダの概念

Q 手元にあるメッセージをフォルダに分け整理せよ。整理方針を2通り以上考え、一番合った方針を選べ

ネットニュース(NN)

多数ニュース群から成り、1つの群に記事投稿すると、記事は各地に配送され、その群に興味を持つ多くの人が記事を読める情報サービス
インターネット多対多で文字使用情報流通にNNがあるが、報道ではなく利用者が意見表明・議論・教示する「共同掲示版」である。利用者はNN記事にNewsgroups名をつけ、自分のコンピュータからニュースサーバに送る。世界中のニュースサーバ間では手持ち記事のやりとりをし、異なる組織にいる人同士で記事交換が出来る。NNは、Eメールほどではないが古くからある情報サービスで、起源は米国USENETという低速ネットワークである。USENETはNNが代表的サービスの1つ(もう1つがEメール)で、NNをUSENETと呼ぶことがある。投稿は世界中に配送され多数の人が読める。Eメール同様、NNでも投稿に対し追加投稿(フォローアップ)できるが、多数の人が投稿し全記事一緒くたでは(1日数万メッセージ配信)混乱するため、NN記事は話題別ニュースグループに分かれ、利用者は適切な(興味/話題)群を選び記事投稿したり読んだりする。Eメールが「葉書」なら、NNは(一群の)「掲示板」や「新聞」に相当する
トップカテゴリ
NNは、話題別Newsgroup作り、興味を持つ人達がNewsgroupに投稿し情報交換成立 - ニュース群名は、fj.rec.sports.baseballと「.」で名前を区切る形となる。一番右側(baseball)が個々の群を表し、その左側(fj、rec、sports)は幾つかの群をまとめカテゴリ(分類)という。一番左側の名前(トップカテゴリ)毎に、ニュース群の管理・配送方法変わる

代表的カテゴリ:
[□] fj, japan --- 日本を中心に世界各地に流通している。日本語投稿が主
[□] comp, soc, misc, sci, {\tt news}, talk --- USENET群を整理しできた
これら6つを合わせUSENETと呼ぶこともある
[□] alt --- USENETと別alternativeカテゴリを作る主旨ででき、雑多な群構成になっている
地域トップカテゴリ(kanto, okinawa …)や、企業・大学等組織毎に自前トップカテゴリを運用するのもある

カテゴリとニュースグループ(群)
トップカテゴリ下の群構成やその意味、使われ方は、カテゴリ毎に違う。NNでは、W3等と違い複数のやり方の分類が共存できず、分類変更も簡単にはできないので興味ある群を探すのはやや大変
メモ fjは「From Japan」(日本発信)で、「For Japanese」(日本語/日本人専用)ではない
fjの構成例(「*」は「-以下」を表す)  fj.comp.*: コンピュータ, fj.sci.*: 科学, fj.soc.*: 社会, fj.rec.*: 趣味娯楽, fj.rec.autos: 車, fj.rec.autos.sports: 4輪モーター, fj.rec.misc: その他 → fj.rec.autosは単独群かつカテゴリを兼ねる。「娯楽全般」は、fj.rec群ではなく、fj.rec.misc群がある(miscはmiscellaneous)
記事を読む
NNでも、具体的操作はクライアント毎に変わり、カテゴリも違う。想像上のカテゴリ「kou.*」を読む場合の動作を見る。ブラウザ起動で、ニュース群一覧が表示される。各群が1行に表示され、その群の未読記事数が群名の前に表示される。多くのNNクライアントは、未読記事個数0群の一覧(非)表示モードを切替えられる。既読記事は一覧表示しないクライアントもある。マウス等でニュース群を指定すると、その群の投稿記事一覧画面に切り替わる。ニュースクライアントにより、特定群の記事一覧画面から始まるものもある

3: kou.general
2: kou.kamoku.butsuri
4: kou.kamoku.suugaku
1: kou.test
画面例「kou.general」

この一覧画面では、記事番号、記事送信者From:、記事主題Subject:が表示される。左端の「R」表示は「既読記事」を意味する。マウス等で読みたい記事を選択すると、次画面のように記事本体が表示される

R 2418: [sensei@kou.ne.jp] schedule on tomorrow
 2419: [masa@kou.ne.jp] preparation of field research
 2420: [taro@kou.ne.jp] examination on plant ecology

読み終り記事一覧に戻ると、今読んだ記事の所に「既読」印がつく
NNは世界中から刻々と新しい記事が送られるため、コンピュータ機能で未既読を管理し、同記事を何度も読む、重要な記事を読み落すことを防いでいる
記事投稿
NN記事投稿はEメール送信に似るが、送信先To:ではなくニュース群名Newsgroups:と主題Subject:を指定する。多くのNNクライアントで、記事一覧画面で「投稿」選択だけで自動的に群名に見ている群を設定してくれる
既にある記事を引用し投稿するには記事を指定しクライアントの「フォローアップ」機能を選択する。いずれも送信者や日付やメッセージIDの情報が記入されないが、これらはNNクライアントが自動的につける。これらを投稿し終ったあとの記事一覧画面を見よう。ただし、記事が伝わるには遅れがあるため、ニュースサーバが違えば記事や記事番号も違う。記事一覧画面は誰がみても(既読情報を除けば)同じであり、ある人が投稿した記事を誰でも読める
メーリングリスト(mailing list, ML)
ネットワーク管理者が設定用意し、その宛先にEメール送ると群全員に配信される。群は、数人から世界規模まで様々。MLを使えば、NNと違う形で、多対多情報交換が出来る。MLは、公開と参加者以外非公開がある。公開MLも、新規参加を、歓迎から紹介者必要まである。Eメールは基本的に私信だが、MLは、私信と言えず情報取扱・発言に私信・公開両面を考える必要がある
メモ 「旅行情報交換」メールアドレス一覧をメールサーバ登録し、リスト全体名にtravel@abc.def.ghi.jkとメールアドレス設定するとTo: travel@abc.def.ghi.jkで送られたEメールは、その群のメンバー全員に配布される
Q 公開のMLメッセージを見てみよ。そこからMLとNNの違い考えよ
サーバ管理(不正侵入防止)
パスワードのつけ方(時々変更すると盗まれる可能性減少): 簡単に解読可能なもの避ける + メモは見られる恐れ

Ex. [単語 + 数字] / 複数単語先頭部分取出し → 推察されにくい規則によりより安全なパスワードとなる

サービス: 必要サービスのみ提供し、サービス使用可能クライアントを必要範囲にしセキュリティーを高める
  1. TCP_Wrapper (tcpd): アクセス制限設定ソフトウェア。/etc/inetd.confにソフト使用宣言しアクセス制限ホスト名を/etc/hosts.allow, /etc/hosts.denyに記述
  2. SSH, sechure shell: 計算機間通信を暗号化し行なうプログラム (OpenSSH等)
    Ex. ssh 利用促進にtelnet, ftp利用制限設ける
  3. SSL, secure socket layer: パケット暗号化方式の1つ。W³ブラウザ-W³サーバ間パケット暗号化プロトコル使用
  4. 公開鍵暗号方式(共通鍵暗号アルゴリズム)
DES, Data Encryption Standard: 1974年IBM開発 → 1977年NISTが米国政府標準暗号に採択

鍵データ長56 bit、ブロック長64 bit。56 bitは約1017乗の組合せだが、総当たり法で解読できる
TripleDES: AES正式決定まで用いたDES処理を3重化し、2つのDES鍵(1回目3回目に同鍵使用し、処理3重化だが鍵は2つ)を使い112 bit鍵長とする方式

AES, Advanced Encryption Standard: NISTが1997年から公募した次世代共通鍵暗号アルゴリズム

鍵データ長128 bit、ブロック長128/192/256からの選択がNISTの要求仕様。15方式が候補に提案され、IBM MARS、RSA Raboratories RC6の2つが最有力候補となりNTT E2が追う状況だった

デーモン daemon: ファイルシステム障害常時監視プログラム

→ 最新な少セキュリティホール版に常時更新

  1. OS起動時に起動され常にクライアントからの接続要求待っている
  2. クライアント要求毎にinetd (internet super-daemon)介し起動される。一般ユーザは殆ど不要。/etc/inetd.confに記述(suのみ変更可)
    ps acux: PCで動いている全プロセス表示(UNIX) – これにより不要なdaemonをチェックし外す
メールサーバデザイン
  1. POP, post office protocol: メールサーバ上にあるメールボックスへアクセス用プロトコル。クライアントから、配信されたメールをダウンロードする等に使用。POP3 (= POP Version 3)
    POP before SMTP: 一定時間前にPOPを行ったからホストからのSMTP中継のみ認める
  2. APOP: 次世代メールサーバデザイン。APOP利用促進にPOP利用に制限設ける
  3. IMAP

Web-BBS

BBS, Bulletin Board System: 電子掲示板システム。PC通信の同義語として使用されることもある
W³情報公開機能に、掲示版機能をつけたのがWeb-BBSである。Webページ内に掲示版を作り、閲覧者は誰でも閲覧、書込み、できる。Web-BBSは、誰でもその情報を入手でき私信より公開された通信とし扱われ、プライベート情報書き込み等の知的所有権やプライバシー保護問題を生じさせがちで注意が必要である
Q 既公開Web-BBSを見物し、NN, MLとの違いを、表に追加してまとめよ
インターネットでの情報流通
インターネットを使った情報流通のあるべき姿
インターネットメッセージ: W3内容(コンテンツ)、e-mail, NN記事等全て

情報流通方向性 → 発信・受信情報が誰から誰に発信されたか把握大切
インターネット利用者 = 情報受信者と同時に情報発信者

新聞・放送等マスメディアと同じ立場に立ち、発信の責任自覚必要

e-mail, NN: 同様の問題起こるが、反応が直接、発信者に届き、使いつつ教育を受けられる
W³: 作成コンテンツに対する反応が直接的に得難く、周囲の指摘で適切な使い方を身につけること困難

→ Webページに掲示版機能等 → コメントもらうと反応得やすい

情報流通方向

W³: Webファイルをサーバに記憶 → ページ閲覧者はサーバに内容公開要求 → サーバから情報転送
Web閲覧者はEメール等用い作成者に連絡 → 作成者はWebページ改訂
W3はNN同様1対多数情報交換だが、NNと異なり文字以外の情報流通可
Web話題は作成者決定 → ページは話題別分類出来ない点が「共同掲示版」, NNと異なる

問題解決におけるコンピュータ活用方法


過程(プロセス) process: 背景情報や既存の断片的知識を関連づけつつ問題解決を図る。

Ex. 創造活動  新アイデア誕生過程 , 問題解決  分析・改善過程
「問題」内容は多様で、解析的に解けないことも解が複数のこともある。複雑な問題の抽象化細分化により問題を明確にし、解決へのコンピュータ活用法を考える。内容は、問題発見(問題把握、観察情報収集)、問題分析(文章情報整理、モデル化とアルゴリズム)、問題抽出(目標設定、モデル作成)、問題解決(シミュレーション、待ち行列、数値的モデル、数値計算)等

アルゴリズムが分かれば、プログラム作成、アプリケーションソフトウェア活用、具体的問題解の獲得ができる。その後、得た結果が目的物かを評価する作業があり、評価は、多データの組合せでどの位機能するかを調べる作業である。無限データテストは不可能なため、選択的テストが行われる

問題発見から問題把握

「問題解決」とは、数式を解く、社会問題を解く、友達間問題を解決する?…、と曖昧で様々な解釈が可能である。「問題」を誰がどのような場面で発っしたかでも問題解釈は異なる。情報処理の問題発見は、現行の仕組に潜む問題を見つけ出すことである。新事象を取り入れる、現状改善をする時、その原因問題を見つけようとし、同時に解決方法を考える。単純モデルで表現可能なのは稀で、複雑問題解決には、問題状況を分析し幾つかの問題に分割する方法が考えられる。個別解を統合し、複雑問題を解決する一連の案を示すと言える
モデル model: 模型、原型、様式、見本という訳で分かるよう広範囲で使われるが、現象を定量的に解く数式、ものの見方、捉え方という意味で使う
モデル化 modeling: モデルを作ること。実世界の対象を抽象化し表現すること
問題把握過程は、「仕組現象観察→状況発生関連情報収集→収集情報整理→データ分析→問題抽出」となる。日常は、曖昧な言葉で状況を語り、曖昧な表現で質問を発している。「明日の天気は」と尋ね、明日の行動を知る仲間同士なら状況判断し容易に答えられる。挨拶代わりの会話なら、いい加減な応答も問題はない。しかし、適切な答えを期待する場合は、場所と時間が限定された質問ではなく、この問いかけに対する答えは難しい
情報処理問題解決には、多くの情報とそれを使い解決する過程がある(Ex. 天気予報には多データとその処理解析方法や手順)。しかし、コンピュータ利用する情報処理は、科学的法則に拘束される訳ではなく、過剰な人為的処理が行われないよう工夫し、条件を付け曖昧性を排除する。問題解決には、新方法発明も必要だが、既存の方法を応用した解決方法も考える。その場合でも具体的な状況に既存の方法の当てはめ方を考える必要がある
観察と情報収集: 問題把握は仕組や現象を観察することから始める。この時、問題状況が何を発しているかに注目し、意識的に情報収集することが必要である。つまり、問題把握は現象の調査分析が前提である。よく使われる調査方法として次の5項目をあげる
  1. 文献資料調査(資料調査): 既存資料使い情報収集する。活用できる資料には、書籍雑誌新聞等マスメディアが公開しているもの、インターネット等電子メディア、国や都道府県等公共機関所蔵物等がある
  2. 状況に詳しい人の意見聴取(インタビュー・アンケート): インタビューは関係者に会い話を聞き、内容を記述する。アンケートは質問事項について回答者に記述してもらう。アンケートは、相手に会うとは限らない
  3. 関係者意見交換: ブレーンストーミングやヒアリングがある。ブレーンストーミングは関係者が問題について自由意見を述べ合う方法、ヒアリングは状況に詳しい人を呼んで質問する方法である
  4. 現場観察: 問題のある場所に出向いて状況を観察し記録する。これによって、様々なデータを取得できる。時間的な状況の変化がある場合には何回も現地で観察することがある
  5. 問題環境に入り試す: 問題があるとされる仕組に入り関係者の行動を観察し、得られた知見をもとに仕組に影響を与える介入をし関係者の行為や行動の変化を調査する。(4)では状況に影響を与えないよう外部から観察していたのに対し、問題状況に入り干渉するという違いがある。人間行動分析に有効な方法である
調査はこれらの方法のうちどれか一つを選んで行なっても、複数の方法を組合せてもよい。利用する方法が多いほど、現象を多面的に捉えることができ、問題解決における視点も広がる
Q (1)-(5)の方法は、どのような問題時に役立つか、身近な例をあげ、何故その方法が使えるか説明せよ
Q 交通渋滞箇所で話題になる交差点がある。原因を知るには、どう調査するのが最適か、理由は何か

問題分析

情報処理における問題解決方法は1つではない。人間は勝手な規則を与え問題を複雑にしてしまうこともある。調査で得られた情報の本質を理解するため、状況整理が必要となる
文章情報を使った状況整理
KJ法(発想整理手法) 開発者川喜田二郎頭文字: 得た情報を簡潔にカード記入しキーワードで関連カード分類を繰返し状況分析する方法。文章でイメージが湧かない場合、図化し直観的に理解するのに有効
手順
  1. 言語データ収集カード化
  2. 類似カードグループ化
  3. グループ表札付け
  4. 表札束について2-3を繰り返す(配置)
  5. 配置ごと貼りつけ枠で囲む(図解)
  6. 図解を見ながら文書化
KJ法アプリケーションソフト: 羅列した文を系統的に整理したり、問題点等を抽出する時に便利
問題背景や概略を示す略図の他、データ間関係を示す実体関連図(実体間関係を表した図)、実体とプロセスの関係を示す、即ちデータがどのように流れて処理されるかを示すデータフロー図等がよく使われる。Ex. 陸上競技大会開催という状況設定を通し、どのような問題があるか、その状況を分析する
実体 entity: 対象の仕組に関係する人や物等を抽象化し捉えたもの。Ex. 学校そのものは実体ではなく、学校名、所在地、学級名等の属性を取り出しまとめたもののこと
プロセス(過程) process: データの処理(中)のこと → 実行状態にあるプログラム。TaskとThreadの総称
タスク task: 実行状態のプログラム。状態情報を完全に持ちコンピュータ内で独自に動く (≈ プロセス)
例題. 陸上競技大会を開催したい
「企画運営を小人数で効率よく行なう」目標が掲げられた。実行時にありそうな問題を調べ、事前に解決方法を考えた(催し企画問題)。早速催し企画問題に取り組むことになり、準備委員会を開き、以下の発言を得た。()内は整理につけたキーワードであり、[]内は参照記号

発言内容
会費は幾ら (収入、人) [a]
会計係が必要だろう。(人、作業) [b]
まず、予算を立てるべきだネ (収入、支出、人、物) [c]
どんな経費があるのか (支出、人、物、作業) [d]
大会当日のアルバイト代は幾らか (人、支出) [e]
アルバイトは何人必要か (人、作業、支出) [f]
大会案内状発送は何時できるか (作業、人、支出) [g]
名簿はあるか (作業、人) [h]
参加校名簿は去年のを使うが、選手・関係者名簿を作成する必要がある (作業、人) [i]
会場略図も必要だ。(作業) [j]
会場迄の道順、バスダイヤも用意せねば。(作業) [k]
グラウンドや会場の整備も必要だ。(人、作業) [l]
大会終了後、記録等報告書作成が必要です。(作業、後日) [m]
競技記録記述方式を決めると整理に便利? (作業) [n]

発言を、キーワード整理すると、経費関連問題、運営問題、報告書作成問題に分かれる。「収入」と「支出」をキーワードに選ばれた項目a, c, d, e, f, gを経営問題とし、「作業」に関する項目b, d, f, g, h, i, j, k, l, m, nを運営問題とした。「後日」に関する項目mを報告書作成問題とし別群とした
コンピュータ利用: 利用者からみたコンピュータによる演算処理利用目的

演算処理: 数値四則演算を始めとする科学技術計算、大量データ統計計算、論理演算、文字列処理、画像処理等
情報蓄積と検索: 文献情報、事実情報等を蓄積し必要時に情報を取出す処理。Ex. DB
シミュレーション: 理論実証、仮説検証、あるいは設計制御のために行う模擬実験等
事務処理: 販売在庫管理、給与計算、原価計算等の業務を支援する様々な処理
文書処理: 文書の作成や清書、機械翻訳等
コミュニケーション支援: Eメールやファイルによる情報交換、マルチメディアプレゼン等
機器制御: 航空機自動運転、ロボット製造工程制御、鉄道運行管理、エレベータ制御等

問題分析解決では、複数処理を組合わせ、速く、広く、正確な処理が要求され、そのためのソフトウェアも提供されている。しかし、現実問題は複雑でコンピュータ活用には、自らプログラムを開発することも多い
数値データ処理
プログラミング programming: 問題の抽象モデルを作成しアルゴリズムを考え、コンピュータ言語で表現すること
アルゴリズム algorithm: データ構造に基づき有限時間内に問題解決するよう、入力データ、演算処理手続、出力結果を、表現記述した手続き → データ構造 + アルゴリズム = プログラム (Wirth パスカル開発者 1992)
数値データを入手し、大量データ処理や演算処理をする。数値データを加工して現象状況が見えることもある。少データ量で簡単な計算なら人手処理可能だが、ミスを犯し計算も遅く、繰返し処理はコンピュータが優れる。プログラミングによりコンピュータ処理が行え、コンピュータ自動化が実現できる。プログラミング内容は、解決問題モデル化/アルゴリズム作成/プログラム作成/プログラム動作確認、が含まれる。問題分析重要工程はモデル化とアルゴリズム作成である。処理作業を記述すると、幾つかの演算に分解でき、これらの演算種類を基本演算命令と呼び、基本演算命令を組合わせコンピュータに記憶させれば迅速正確に演算処理を行う

問題のモデル化とアルゴリズム

コンピュータ利用問題解決は、問題モデル化、意味明確化が重要でモデルは1つとは限らない。モデル化に必要な点に、

1 = データ正確再現, 2 = 簡単, 3 = 他データに汎用的に追従可能

がある。モデル化のできは、プログラミング工程に大きな影響を与え重要作業
モデル化 modeling: 抽象化により問題の本質を明確にすること

program
図. (a) ケーニヒスベルクの橋. (b) 橋のグラフ

Ex. 「ケーニヒスベルクの橋」(オイラー 1736)は、東西に流れる川の中州に2島E, Wがあり、その島間と南岸北岸と島間に橋をかけ、全橋を1回ずつ渡り出発地点に戻れるかという問題 → 答は「できない」。このモデルは、ある点から出発し一筆書き可能かと言う問題に帰着でき、現実問題が抽象化されモデルを描く。数学問題は抽象化が多く、現実問題をモデル化したものといえる

問題抽出

目標設定
問題解決には、何をどこまで解決するかという具体的目標値必要
Ex. 「催し企画問題」: どのような問題が設定できるか。発言事項をまとめ解決せねばならない問題をパターン毎に整理すると、経費問題2、運営問題6、報告書問題1つあり、問題の要点は以下の様に記述できる
経費問題
  1. 予算を立てる参考に最近5年間の参加費、補助金、その他のデータを収集し表を作成
  2. それぞれの単価表を利用し、以下の5項目を算定し必要経費を計算
    1. 人件費: 参加者50人につき一人の手伝い要員がつく
    2. 会場費: グラウンドの使用料(固定)と控室使用料(参加者数をみて決定)を計上する
    3. 郵送費
    4. 印刷費: 印刷物によって配布先が異なる問題がある
    5. その他: 機材の借用費、運搬費、ゼッケン等
運営問題
  1. 競技大会用の案内の中に、会場の略図等を入れる
  2. 種類によって配布方法が異なる資料を効率よく配布する方法を考える。<例題2.4参照>
  3. 過去のデータを参照して各競技に必要な時間を設定する
  4. 受付が混乱しないよう、大会前日9時から17時の間に行うものとして、受付窓口の数と作業分担を決める
  5. 参加者名簿を作成する
  6. 第一回大会から前回までの大会記録を整理し各競技の大会記録表を作成する。これを、新記録の情報を速やかに発表するために役立たせる。また、競技成績一覧を作成する
報告書問題 1 収支決算書を作成する
モデル作成
関係者間情報や作成データ相互関連(図2.7)等、多問題を含む時に全体図示化は理解を助ける
Q 新聞作成の作業分担を考えると、どのような係が必要になるか。係間で情報はどのように流れるかを図示せ。新聞作成で収集する情報源(データ実体)と情報の活用プロセスの関係をデータフロー図で示せ
             ░░░░░░░░░░参加者░░░░░░░░░░
           ab↗ ↙c      f          d↘ ↖e
      ░░░大会運営者░░░ ⇆⇆⇆⇆⇆ ░░░アルバイト要員░░░
                         g
図. 大会関係者間情報の流れ。░: 関係者、矢印: 情報流方向。a: 競技大会案内(事前配布), b: 広報(事前案内), c: 名簿(事前申込), d: 出欠情報(当日確認), e: 競技進行資料(当日配布), f: 確認情報(当日), g: 業務指示書
    参加者名簿───────会 計  情 報─────┐
        │  └歴代大会*の資料┘ │            手伝要員名簿
        │          │      本部要員名簿─────┘
        │          └───┐  │
        └─────────情        報───広報
                     運営計画                一般
図. データ相互関連。枠: データモデル。線: データ同士が直接関係する。参加者名簿: 個人コード、参加者氏名、所属学校名、参加競技番号で構成。他名簿: 氏名、所属、住所、電話番号で構成。会計情報: 参加費、補助金等の入金データの他、使用料、人件費、印刷費、郵送料等基本データ表を含む。歴代大会資料: 第1回大会からの報告書綴り。運営計画情報: 大会当日競技進行プログラム、担当者一覧、競技記録記入表、要員配置表、会場整備図面等。*: 長期保存資料。無印: 本大会期間のみ保管データ
                    [    本部要員名    ]┌[歴代大会資料]────┐
  [  1: 本部     ]           │ ┌───┘                      │
  [参加者名簿作成]           │ │  ┌──[手伝要員名簿]──┐  │
         ↓                  ↓ ↓  ↓          ↓          ↓  ↓
┌[  参加者名簿  ]→[      2:本部      ]→[ 担当者一覧 ]  [  3: 本部   ]
│      ↑↓        [   運営日程決定   ]────┐        [運営予算作成]
│[  4: 受付係   ]                              ↓              ↓
│[参加者出席確認]←[競技進行プログラム]  [運営計画情報]  [  会計情報  ]
│[資料渡す      ]              ↓              │              ↓
├────────→[  6: 実行委員会   ]        └───→[  5: 広報係 ]
│[   記録一覧   ]←[競技進行・結果記録]                  [ 案内書作成 ]
│                                                              ↓
└───────────────────────────→[ 報告書作成 ]
図. 催し企画(大会関係者-資料活用関係)データフロー。□: データ実体。中線入枠: 線上側にプロセス(過程)番号と担当部署、下側にプロセスを記す。過程から出ている矢印: 処理により得られたデータを格納していること。過程に入る矢印: データを利用すること。Ex. 過程6の実行委員は、競技進行プログラムと参加者名簿を利用して競技進行し、成績を記録一覧に記述している。参加名簿というデータ実体は、過程1で本部で作成され、過程2, 4, 5, 6で利用される。無入力矢印のデータ実体は、既存の実体である

問題解決

プログラム開発: プログラミング言語 + 編集用エディタ + 管理ソフトウェア(バグ検出、プログラムテスト)
問題がモデル化できれば、プログラム開発せず、ワードプロセッサ、描画・表計算・プレゼンツール、DB、ブラウザ等既存ソフトで処理も可能。コンピュータと手作業での計算上の違いは:
  1. 手作業はデータ毎に計算式展開するが、コンピュータ処理は式を1回記述すればデータを変えるだけ
  2. 手作業では途中で0になった項は以下省略し計算するが、コンピュータは常に全ての項の計算をする
  3. 手作業では分数表示を使用できるが、コンピュータでは小数点表示
ただし、コンピュータに、良いモデルとアルゴリズムを与えなければ正しい結果が得られないこともある

シミュレーションと確率モデル

現象に直接触れない実験にコンピュータシミュレーション(模擬計算) computer simulationが便利である

Ex. 交差点信号: 交差点に行かず自動車の流れを最適にする信号点滅間隔をシミュレーションで現場信号点滅と殆ど同じ状況を作り出し決める
シミュレーションでは、道路、交差点、信号機、自動車等のような対象物を確率変数 probability variableを利用しモデル操作をする。実際の確率変数が得られなければ乱数を使い確率変数の近似値を求める

数値的モデル

数値処理には判断や繰返しの必要条件を組合わせた問題がある。Ex 催し企画問題問題
例題2.4 数値の桁抽出 Ex. 運営上問題は、種類により配布方法が異なる資料の効率よい配布方法を考えることであった。名簿にある個人コードを使った分別方法を考えよ。参加者名簿が、個人コード|氏名|所属学校|参加競技番号のように構成されているとする。個人コードは、受付番号(3桁)|学校(2桁)|性別(1桁)|年令(2桁)からなる8桁整数値とする

8__7__6_| 5_4_| 3___| 2_1_
受付番号 | 学校 | 性別 | 年齢

個人コードデータの学校別コード(4-5桁)を抽出し同じコードをまとめると配布先を群化でき、この問題は以下の桁抽出モデルとして一般化できる
桁抽出モデル
n桁整数特定j桁分抽出」問題のモデルで、特定数桁を残し他を削除するアルゴリズムを考える。与えられた整数値d、整数値桁数n、抽出範囲i桁目からj桁分とおき、抽出データrを求めるアルゴリズムを2通り示す

Ex. 1: 上位桁を始めに削除
d/10n - (j - 1)の剰余をxとする(xにはin桁目の数値が入る)
x/10n - (i + j – 1)の商を求めrとする
Ex. 2: 下位桁を始めに削除
d/10n –(i + j – 1)の商をxとする(xには1 … i + j – 1桁目の数値が入る) → x/10jの剰余を求めrとする

Q 例題の名簿の個人コードから学校コードを抽出しなさい。(ヒント: i = 4、j = 2を使う) 例題2.5 経費の見積
経費問題2は、単価表をもとに以下5項目を積算、予算を見積もることであった。1)人件費, 2)会場費, 3)郵送費, 4)印刷費, 5)その他: 機材の借用費、運搬費、ゼッケン等。各項目毎の計算アルゴリズムを考えよ
(1) 人件費計算
Q: 参加者50人につき1人の割合で手伝い要員をおき、参加者に端数がある場合には1人追加するものとする。手伝い要員の人件費を1人当たり8000円とすると人件費はいくらになるか。参加者数を与えて計算せよ
n参加者数、k群人数、c手伝要員1人当たり人件費ならば「nkを与え、nkづつの群に分け、端数を別途1群とし、群数gを求める。データcを与えc × g (人件費合計) を求める」モデルで示される

アルゴリズム
1: n, k, cを与える
2: n/kの商 = g
3: n/kの剰余 = r
4: r ≠ 0ならg = g + 1
5: c × g = f
6: gとfを出力(出力信号output signal)
→ 結果は手伝い要員の人数gと人件費fの表示(出力)

(2)会場費計算
Q: グラウンド使用料 = 一括5万円。参加者控室 = 100人収容可能部屋3 + 60人部屋5 + 30人部屋5予約可能。使用料 = 100人部屋1.8万, 60人部屋1.2万, 30人部屋0.7万円。参加者数に合わせ最も安価な使用料計画作成 → 参加者数与え表を完成する問題
参加者数x、部屋種類k、収容人数ni、空部屋数fi、使用料単価pi、予約数mi、使用料siとおき、問題解決流れ図を示す。添字のiは1, 2, 3, …, kと変化する (問ではグラウンドがk番目の部屋に相当)

____1枠アルゴリズム
_____1. c = 0とおく
_____2. i = 1とする
_____3. c + nifiをcに代入
_____4. i + 1をiに代入
_____5. i < k → Step3へ
_____6. 終わり

____2枠アルゴリズム
_____1. i = 1とする
_____2. miに0を代入
_____3. siに0を代入
_____4. i + 1をiに代入
_____5. i < k → Step 2へ
_____6. 終わり

3枠アルゴリズム

  1. x, k, ni, fi, piを与える
  2. i = 1とし、xyに代入
  3. y/niの商をmiに代入
  4. y/niの剰余をrに代入
  5. mifitに代入
  6. t > 0ならfiをmIに代入し、ni × trに加算しStep 10へ
  7. t = 0ならStep 10へ
  8. i = k – 1ならStep 12へ
  9. r > ni + 1ならmiに1を加算して使用料の合計計算へ
  10. r = 0なら使用料の合計計算へ
  11. i < kならiを1増やし、ryに代入してStep 3へ
  12. r > 0 → miに1を加算し使用料合計計算へ, r = 0 → そのまま使用料合計計算へ

____4枠アルゴリズム
_____1. i = 1とする
_____2. fimiに代入
_____3. i + 1をiに代入
_____4. i < kならばStep 2へ
_____5. 終わり

____5枠アルゴリズム
_____1. i = 1とする
_____2. mi × pisiに代入
_____3. i = 1をiに代入
_____4. i < kならばStep 2へ
_____5. SUM = 0とする
_____6. i = 1とする
_____7. SUM + siをSUMに代入
_____8. i + 1をiに代入
_____9. i < k + 1ならStep 7へ
_________結果を表示して終了













                            (始め)
                              │
           1. [収容可能な人数を計算しcとする]
                              │
         ┌───── <cとxを比較する> ──────┐
         │ x < c             │                   │ x > c
  2. [misiを0とする]        │ x = c     [収容能力不足を示す]
         │                   │                   │
[部屋の予約数を計算する]      │←──── <使用を中止する>
         │                   │          No       │Yes
         │         4. [fimiに代入する]          │
         └─────────┤                    │
                 5. [使用料の計算をする]           │
                             │                    │
                      /結果を表示する/             │
                             │                    │
                         (終わり)────────┘

図 流れ図

(3) 郵送費計算
Q: 学校毎配布資料1部250 g以下、個人毎配布資料1部25g以下。資料を一括し学校郵送時に通信費上限は幾らか。参加校は30校以内で、一校あたり参加者は最大15名とする。(解) 25 g × 15 + 250 g = 625 g、1 kg 以内で一校あたり最大郵送料700円。通信費上限700 × 30=21000円。この料金計算アルゴリズムを作れ

表 郵便料金表
形状_____定型_____非定型
重さ(まで) 25 g__50 g 50 g 100 g 250 g 500 g 1 kg 2 kg 3 kg 4 kg
料金(円)__80___90__130 190__270__390__700 950 1150 1350

(4)印刷費計算: 学校毎の印刷物は一部500円、個人毎の印刷物は一部30円の印刷費がかかる
(5)その他: 機材借用費と運搬費等は計5.5万円、ゼッケンは選手1人1000円以内とする(選手数 < 参加者数)
Q 各学校参加者数を与え、通信費と印刷費を計算するモデルを考えアルゴリズムを示せ
Q 項目1-5までの経費を効率よく計算する手順を流れ図で示せ (ヒント: 各項目処理をまとめ、共通データを一度だけ入力し、複数項目で共用を考える)

アルゴリズム

問題意味明確 → アルゴリズム作成可能: 一意的に解決できなければならず、記述は有限で、実行時間も有限

アルゴリズム: 一般に定義域(入力)と値域(出力)が定められ、入力0個以上、出力1個以上が与えられる
アルゴリズムの性質

  1. 定義域と値域の関数性
  2. 解釈一意性
  3. 記述有限性
  4. 時間有限性

よいアルゴリズム = 実行時間と占有記憶量両面で効率よい

APソフトは、利用者自らプログラミングせず、コンピュータ活用し問題解決でき、エンドユーザコンピューティング (End user computing, EUC)と呼ばれる。数値処理問題では背後環境に依存せず、高使用アルゴリズムはライブラリーソフトウェアを用意し、プログラムを書く場合に呼出すだけで利用できる
ライブラリー library: 繰返しや判断、数式の計算処理等のプログラム部品
動的リンクライブラリ DLL, dinamic link library: プログラム本体と別にあり、実行時に動的に接続するライブラリ
利点は、複数プログラムが同機能を使う場合、全プログラムに同じコードを含める必要なく、同処理に同ライブラリを使え、資源節約でき、ライブラリさえ差し替えれば利用する全プログラムが修正される(普通DLLと言うとWindows用を指す) ↔ 静的リンクライブラリstatic link library

分割アルゴリズム partitioning algorithm

例題 植物Aは生育2年目以降、毎年株分けできる。2年経った株を毎年株分した時の株の増え方はどうか
    1年後   2年後   3年後   4年後   5年後   6年後
     △──→〇─┬→〇─┬→〇─┬→〇─┬→〇
                 │      │      │      └→△
                 │      │      └→△──→〇
                 │      └→△──→〇─┬→〇
                 │                      └→△
                 └→△──→〇─┬→〇─┬→〇
                                 │      └→△
                                 └→△──→〇

図2.3 株の増え方。△は株分けできない子、〇は株分けできる親を示している
この植物が、n年目にtk株になれば株数はt1 = 1, t2 = 1, t3 = 2, t4 = 3, t5 = 5, t6 = 8 … の数列で表せ(図2.3)、t1 = 1, t2 = 1, tk = tk-1 + tk-2で定義できる(k = 3 … n) (フィボナッチ数列)
Q フィボナッチ数列の各項を求めるアルゴリズム示し、10年後の株数を求めよ

(__) 端子: 始めと終わり
/__/ データ: 入力と出力
[__] データ: 処理
_≫ 判断
ループ: 始まり
ループ: 終わり
---- 線: 処理の流れ
◎ 結合子

______________( 始め )
_________________|
________[ t1 = t2 = 1, k = 3とおく ] _________________|
_____________/ Nを与える /
_________________|
no_____[ tk-1 + tk+2tkに代入する ]
_┏━━━━━━━>|
___________[ 1を増やす ]
_______________|
_┗━━━━━ ≪ k > N
_________________| yes
____________[ tkを表示する ]
_________________|
_____________( 終わり )
図 株分け問題流れ図 (流れ図の主な記号 JIS X0121抜粋改変)
1. 直接的方法: 起こりうる全ての場合を調べることが可能な時
a) 解析的に手順が定まる時: 最小値、最大値等直接全てを解析的に求まる → そのままプログラミング
b) 総当り法method of all possible combinations: 全事象を調べる – 力ずくだが、計算回数少ない時は有効

Ex. オードスミス法 Ord-Smith metohd: 組合せ要素数nを与え、n!個全組合わせをアルファベットで作り出す

2. 起こりうる全事象を調べるのが不可能な時: 天文学的組合せ数 → コンピュータでも計算に膨大な費用と時間
a) ダイナミックプログラミング dynamics programming

Ex. PQ: n段階を経て移動。各段階はm個の状態があり各段階ではこのどれかの状態となる。i段階のj状態から(i + 1)段階のk状態に移るにはCi(j, k)のコストがかかる。この時PQ移動の最小コストを探す

algorithm

f(i, j)をPからi段階のj状態に行く最小のコストとする

社会データ分析 (social data analysis)


社会調査法

1) 心理学的実験: 被験者に対する実験によりデータを収集する方法
2) 記述・統計データ処理 → ex. アンケート enquete 調査法

サンプル・センサス sample census Ex. 回顧調査 retrospective survey

無作為抽出 ↔ 有為抽出

標本抽出の主観性排除できず誤差の影響を統計的推定すること困難だが、実施容易であり、繰り返し調査を行う必要がある場合等に用いる

  1. 紹介法: 知人・同僚・友人等調査協力が得られそうな人々を標本とする
  2. 応募法: 応募者モニター等自発的応募者 = 標本 → 応募者は、調査(商品等)に興味持つため質の高いデータが得られる可能性高い
  3. 典型法: 母集団を代表する典型的な人を選び調査対象とする方法
  4. インターセプト法: 街路、ショッピングセンター等で調査協力依頼。依頼者技量により協力率異なる
  5. 出口調査: 選挙当日に投票所から投票を終え出てきた有権者に、投票した政党・候補者を尋ねる方法。通常の選挙結果予測と違い、投票と同時進行で調査
  6. 割当法: 国勢調査等事前情報を利用し母集団構成比率に等しくなるように標本を集める方法。標本を母集団に似せられるが、調査精度を統計的に評価できない限界がある

参与観察 participant observation

定性的社会調査法の1つ
フィールドワーク中心に、数ヶ月-数年に渡り研究対象社会に滞在しメンバーの一員として生活

外部に閉ざされた様な特異集団調査に威力発揮 (定型的方法未確立)

Ex. ウィリアム・フット・ホワイト「ストリート・コーナー・ソサエティ」

社会学人類学で、特定社会集団研究に用いる + 家庭、教室、会社組織等に対しても用いる
データ = フィールドノート記録 + テープレコーダー・カメラ等の機器

特徴
問題発見しやすく、問題特質を浮き彫りにさせやすい
対象の多次元的な把握に向き全体像描きやすい
問題事象対象者の経験をその内面に遡り理解し、対象者の行為を意味付け問題の深層にアプローチできる
時間を遡り調べられるので対象の変化の過程をとらえられる
欠点
事例極めて少なくなり、標本としての代表性が問題
定型的方法未確立 → 分析成否が研究者・調査者の能力や性格に依拠

一般化困難で主観混じる不的確な観察や恣意的推論の介入する余地大
反復検証困難

アンケート (questionnaire)


計画 → 準備 → 実施 → 集計 → 分析(解析) → 評価
人の意見や感覚をデータとして集める方法として広範に利用
事前に質問文用意 → 質問に対する答え方通じ回答者の意見や感覚を知るデータ収集方法

元々「郵便質問紙による調査」の意味 → 郵送以外の方法も含める
Ex. 社会学: 社会調査や世論調査 → 社員意識調査 motivation research・意見調査
Ex. 経営学: 市場調査 → 顧客満足度・要望を調査する顧客満足度調査
環境医学: 疫学調査 → 「授業アンケート」

目的: 先に明確な問題意識・課題があって、その解を得るため調査実施

仮説検定: 仮説検証が目的 → 仮定(仮説)を設け、その仮説が成り立つかをデータで確かめる
現状把握: 研究テーマ等、関心事に関する現状を調査し問題状況を把握(推定)し、意思決定や仮説設定等の次行動に活用することが主目的
→ 調査対象や回収データの解析方法等は、目的により自然と決まる

標本誤差 (sampling error)
標本抽出に伴う誤差 (標本抽出法) → 調査は必ず誤差が伴う
非標本誤差: 調査過程におけるミス等 → 標本調査、全数調査に関わり無く生じる誤差 → 非標本誤差の客観的評価は困難
  1. 単純ミス: 数字・記号の付け間違い、計算ミス等 → 調査各段階できめ細かく管理し抑制
  2. 無回答誤差: 調査漏れや低回収率に伴う無回答の誤差・偏り
  3. 回答の偏り: 回答者が意識的でも無意識的でも偏った回答をした場合に生じる偏り

→ 2, 3は調査方法に大きく依存

質問調査表アンケート調査でも、面接調査と配布記入調査で結果に差がある
表1. 調査方法の特徴
questionnaire

回収率: 回収した質問表のうち、"一部でも記入されている"ものの全配布数に占める割合

アンケート調査は、回収率や回答の偏りに注意し調査方法を選択する必要がある。郵送法回収率は低いのが普通で、回収率が高い時は標本抽出の仕方や調査の仕方を疑う必要があり、収集データは低回収率のため非標本誤差が大きすぎ統計的推測が成立しないことが多い
無回答誤差
調査漏れ原因
  1. 調査対象母集団の名簿もれ、回答者の転居・死亡による不在、等
  2. 配布調査表の回収不能や、回収したが白紙
重大ケース: 回収率低い + 回答数中に一部の質問項目にのみ回答しているもの含む
→ 質問項目によっては有効回答率が見かけの回収率より更に低くなる
Ex. 1質問項目のyes-no回答を求める調査 → 無回答(無回答群)中には本音がyesあるいはnoが含まれる
Ty = Ay/Tn = (Ta·Ay)/(Tn·Ta) + (Rn·Ry)/(Tn·Rn)

Ty: 全調査対象yes比率
Ay: 回答群yes者数
Tn: 配布総数
Ta: 回答者数
Rn: 無回答者数
Ry: 無回答者群yes者数

Ta·Ay = Fa, 有効回答率
Ay/Ta = Ar, 回答群yes比率
Rn/Tn = (TnTa)/Tn = 1 – Fa
Ry/Rn = Rr, 無回答群yes比率
Ty = Fa × Ar + (1 – Fa) × Rr
この式に、実効値0となる同一値加減項「ArAr」(= 0)を加え書き換えると、
Ty = Ar + (1 – Fa) × (RrAr) → Def. 無回答誤差 Ae ≡ |RrAr|
ArAe < Ty < Ar + Ae
表. 無回答誤差の計算値
       |Rr - Ar|

  Fa   1.0  0.9  0.8  0.7  0.6  0.5  0.4  0.3  0.2  0.1  0.0

  0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
  0.10 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10
  0.20 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0.14 0.16 0.18 0.20
  0.30 0.00 0.03 0.06 0.09 0.12 0.15 0.18 0.21 0.24 0.27 0.30
  0.40 0.00 0.04 0.08 0.12 0.16 0.20 0.24 0.28 0.32 0.36 0.40
  0.50 0.00 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
  0.60 0.00 0.06 0.12 0.18 0.24 0.30 0.36 0.42 0.48 0.54 0.60
  0.70 0.00 0.07 0.14 0.21 0.28 0.35 0.42 0.49 0.56 0.63 0.70
  0.80 0.00 0.08 0.16 0.24 0.32 0.40 0.48 0.56 0.64 0.72 0.80
  0.90 0.00 0.09 0.18 0.27 0.36 0.45 0.54 0.63 0.72 0.81 0.90
  0.10 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00

|RrAr| = 0.20, Fa < 0.5 → Ae > 10%, Ty < 50% → 実は少数派ということが起こりうる
Fa = 0.4, Ar = 0.6, |RrAr| = 0.20 → Rr = 0.80 or 0.4となり、後者の場合には、式より、Ty = 0.6 + 0.6 × (0.4 − 0.6) = 0.48 となり、全体に占めるyes比率が回答群のyes比率0.6より小さい場合があり得る
アンケート調査重要事項
  1. 有効回答率を上げる
  2. 無回答率を下げる
母集団特性を知る = データは科学的に裏付けられた方法で処理されること

アンケート調査方法

調査成否は計画立案段階にある
仮説検証: アンケートは最初に計画 → その計画に従い実施せねばならない

計画不十分なアンケートを実施しても、信頼性の高い結論や、行動の指針になるようなものは何も得られない

アンケート計画立案の内容は次の10項目を明確に決めること
  1. 調査目的: 結果を何のために使うか
  2. 調査項目: 何を知りたいか、何を調べるか
  3. 調査対象: 誰に質問するか
  4. 調査規模: 何人に質問するか
  5. 調査時期: いつ実施するか
  6. 調査方法: どのように調査するか
  7. 解析方法: どのように集計し、解析するか
  8. 報告方法: 結果をどう整理し、誰に報告するか
  9. 予算: 経費はいくらか
  10. 日程: いつまでに終えるか
2との関わりで、7を事前決定しておくことが質問項目設定に直接かかわるので、調査表作成に際し重要
報告方法: いつ、誰が、何の目的で、誰に対し、どのような方法で調査したアンケートかという記録

後日、情報としても活用しやすいため、報告書とし文書で行うのがよい

アンケート計画決定 → 準備
質問文・回答文からなる調査票作成 → 予備調査(調査票不備を確認) →結果に基づき調査票修正 → 調査員に対する教育や会場等、実施に必要なものの準備 → 本調査実施
のようなステップで進める
調査票作成
調査で収集しうるデータの質・内容を左右 → 細心の注意と十分な検討が必要

独り善がりの質問や難解な質問を避けるため、できるだけ複数人で作成

調査票構成: 調査票に調査目的項目全てを含める → 項目を単に並べただけではよい調査票できない
作成留意点
  1. 調査姿勢: 調査は、対象者の貴重な体験や意見を聞かせてもらう作業
    → 対象者との友好的な関係下で回答を得るには、対象者を単なる情報収集手段としてのみ見るような観点が些かでも調査票に表れてはいけない
  2. 質問量: 1調査で不用意に多質問項目を設けること避ける → 多質問 → 回答動機付け低下
    調査目的との関連で各質問の意義を吟味し、関連性の低い質問や重複項目は整理し取り除く。「聞ければ聞こう」という安易な考えは、重要質問項目に対する回答の質を低下させる
  3. 質問項目の並べ方: 調査表は、全体として体系的でわかりやすい流れのある構成にする
    冒頭は容易で無難な質問項目を、複雑で込み入る質問を後へ回し、嫌われるものは最後に置くと、無回答率減らせる。類似テーマに関する関連した質問項目はまとめて配置する方が、回答者は質問の意味を理解しやすくなる。「フェイスシート」として性別、年齢、職業、学歴等をまとめて聞く形式が見られるように、質問の流れで関連し聞けるものは、そこに置いた方が回答する意義が明瞭で答えやすい
質問文作成
調査者と回答者の間に正確で円滑なコミュニケーションが行われるには、質問の意味が正しく理解できるよう、簡潔で明瞭かつ具体的質問文の用意は必須
  1. 用語・表現は、対象者中で最も理解力の低い者に合わせ決める。難しい言葉、曖昧な言葉を使わない
  2. 質問文は言葉であり、言葉の意味は、同一文化圏中でも共通ではない → 隠語、特定業界用語、流行語や決り文句等使わない
  3. 黙従傾向: 賛否問う質問で、一方のみ聞くとその答えが多くなる傾向注意
    → 「賛成ですか、反対ですか」と双方の問いかけとする
  4. 1質問中に2以上の論点を入れる(ダブルバレル)のは避ける。Ex. 質問「あなたは、あなたのお父さんやお母さんが、好きですか嫌いですか」 → 解答欄選択肢は複雑 → 誤答招く
  5. 特定見解や意見を述べ、それを前提とする事柄の賛否を問う質問は、その見解や意見を認めない人を無視し、その人達を含む母集団には避けるべき。Ex. 質問「原子力は、資源のない日本では必要なエネルギー源です。あなたは原発推進に賛成ですか、反対ですか」は、前段の見解を認めない人から回答は得られない
アンケート調査回答方法の類別
回答の性質により統計処理の方法異なる
選択回答法: 質問に対し予想される回答内容を予め用意し、該当を選択回答する方法 – 統計処理方法異なる

単数回答 (Single Answer: SA)

質問。あなたの血液型を教えてください
(1) A。(2) B。(3) AB。(4) O。(5) わからない

複数回答(Multiple Answer: MA)

質問。次の家電製品中からお宅でご使用のものを全て選んで下さい
(1) 電気洗濯機 (2) 電気掃除機 (3) エアコン (4) 冷蔵庫 (5) 電気炊飯器 (6) 電子レンジ

自由回答法: 文字通り質問に対し自由に回答してもらう

目的によるが、統計資料への調査結果利用考えると、統計処理できない記述回答は避ける

数量回答: 数字の記入を求める
順位回答 Ex. 好みの程度を数値化して好みの順番を表す
数値回答 Ex. 自分の年収を記入させる

文字回答: ある事項に関する個人の考えを自由に書いてもらう

回収調査票単純集計
対象集団の特色・傾向を見る
ある集団全構成員に対し行われたアンケート調査から、その集団特性や傾向を知る最初の処理は、調査集計から始まる。一人一人のデータを集団全体に渡り集積することで、個人情報を集団情報に変換できる
→ 単純集計: 調査集計により集団の特色や傾向を把握する最初の手続
カテゴリーデータ単純集計: 選択肢回答人数を調べ、その数全体に対する比率を求めること

Ex. ある集団(n = 20)に対し複数回答を求めた場合の単純集計

問. パーティ等に出席した時、好んで飲むアルコール飲料を教えて下さい

次の中から該当するものをいくつでも選んで○を付けてください
1 日本酒、2 ウイスキー、3 ビール、4 ワイン類(含シャンパン)、5 カクテル

回答結果(解答者番号 = 酒の種類)
1 = 3. 3 = 3, 2. 5 = 3, 4, 5. 6 = 1, 3. 9 = 2, 3, 5. 12 = 3, 4, 5. 15 = 1, 3, 4, 5. 18 = 1, 3. 19 = 2, 5. 20 = 1, 4
→ 単純集計表

酒種類_1 日本酒 2 ウイスキー 3 ビール 4 ワイン類 5 カクテル__
解答数______4________3______8______4________5______21
比率(%)____40_______30_____80_____40_______50_____240

複数回答では、比率合計が100%を超えることがある。質問では、20人中10人が○を付けた。○を付けない人にはアルコ ール飲料を飲まない人や選択肢の種類に好みがなかい人等が含まれる。この無回答誤差は、質問をアルコール飲料を飲む人だけが答えるよう設問を組み立てること、選択肢の中に"その他"を設け、小さくできる。一般に、選択回答法によるアンケート調査は、回答者が必ず選べる選択肢を用意することが調査精度を高める
クロス集計表 cross table: 質問項目間関連を調べる最初の手続
2質問項目回答を表の縦横にクロスし集計する。アンケート調査データにはカテゴリーデータと数量データの2種類あり、この組合わせからクロス集計は3種類でき、集計タイプに応じ相関係数計算手法を使い分ける

表. クロス集計の種類と対応する相関係数
クロス集計の組み合わせ → 相関係数呼称
1) カテゴリーデータ/カテゴリーデータ → クラメールの独立係数
2) カテゴリーデータ/数量データ → 相関比
3) 数量データ/数量データ → 単相関係数

クロス集計表のうち、データの片方または両方がカテゴリーデータの場合、分割表と呼ぶこともある
1) カテゴリーデータ/カテゴリーデータ
Case. 複数回答: 回答比率を表す母数の選び方で回答者数比率と回答数比率があり、独立係数算出法異なる
Ex. 年代と酒の好みとの関連調べる → 晩酌するという10人の人に次の質問

2種類以上の酒類を飲む人の場合、組み合わせに偏りがあるかを調べる

問1 晩酌でよく飲むお酒類の種類を全て教えて下さい(○は、いくつでも)

1. 日本酒 2. ウイスキー 3. ビール 4. その他

問2 あなたの年代を教えてください(○は1つだけ該当項に附けてください。)

1. 29歳以下 2. 30-49歳 3. 50歳以上

表. 回答一覧
    回答者番号   1   2   3    4    5  6   7   8   9  10
    酒類        14  13  23  123  234  3  14  13  14   1
    年代         1   3   2    2    1  1   3   2   3   3

複数回答の場合、クロス表作り、その数の比率を回答者数に対する比率(回答者数比率)で表す場合と回答数に対する比率(回答数比率)で表す場合で独立係数の求め方が異なる

a) 回答者数比率のクロス表 Ex. 年代と酒の好みの関連を調べる 表. 年代と酒類のクロス表。()内は比率
         回答者数 日本酒   ウィスキー ビール     その他   合計
  29歳以下   3   1 (33.3)  1 (33.3)   2 (66.7)  2 (66.7)   6
  30-49歳    3   2 (66.7)  2 (66.7)   3(100.0)  0  (0.0)   7
  50歳以上   4   4(100.0)  0  (0.0)   1 (25.0)  2 (50.0)   7
  合計      10   7 (70.0)  3 (30.0)   6 (60.0)  4 (40.0)  20

酒類横計と回答者数の縦計が一致せず、単1回答のように直接に独立係数算出はできない
→ 比率で表し、これから回答者の年代と酒の好みの関連を見る

i) 年代と酒の好みの関連
酒の種類ごとに飲む人飲まない人を年代でブレイクダウンしクロス表作成

単1回答同様手続により酒ごとのχ2を求め、各々の独立係数を得て相関を評価

表. 日本酒でのクロス表 (T: 回答者数. Y/N: 飲む飲まない, N = T – Y)。(_)期待度数
                      日本酒        ウィスキー    ビール        その他
                  T   Y      N      Y      N      Y      N      Y      N

      全体(総計) 10   7      3      3      7      6      4      4      6
    29歳以下      3 1(2.1) 2(0.9) 1(0.9) 2(2.1) 2(1.8) 1(1.2) 2(1.2) 1(1.8)
    30-49歳       3 2(2.1) 1(0.9) 2(0.9) 1(2.1) 3(1.8) 0(1.2) 0(1.2) 3(1.8)
    50歳以上      4 4(2.8) 0(1.2) 0(1.2) 4(2.8) 1(2.4) 3(1.6) 2(1.6) 2(2.4)

表. 各酒のχ2値と独立係数
    酒類          日本酒  ウィスキー  ビール  その他
    χ2             3.65     3.65       4.10    3.19
    独立係数 rs     0.60     0.60       0.64    0.57

rcが0.8 > rc > 0.5 → 年代とこれらの酒類には"やや強い相関がある"
日本酒、ウイスキー、ビールで、年代により最も好みが偏るのはビール

ii) 好まれ方の類似した酒類見つける

→ 2種類以上飲む時に組み合わせの多い酒類を見つける
表側項目と表頭項目ともに酒種類をとり、酒類の組合わせを数えクロス表作成

表. 酒類各組み合わせに対する場合の数のクロス表全体。対角線上の値は、全体行の値と一致
                日本酒 ウィスキー ビール その他 全体
    日本酒         7         1       3      3     7
    ウィスキー     1         3       3      1     3
    ビール         3         3       6      1     6
    その他         3         1       1      4     4
    全体           7         3       6      4    10

酒の組み合わせそれぞれ、「飲む」「飲まない」のクロス表作り、それぞれの独立係数求める
Step 1)日本酒/ウイスキー → 「全体」行から、日本酒、ウイスキーそれぞれを飲む人数をセルに記入
Step 2) 日本酒、ウイスキー両方飲む人数を記入し「N」の各セル数値は、回答者数と整合するよう記入
    Step 1)   ウィスキー ⇒ Step 2        ⇒ Step 3) ウィスキー
               S  Y  N       S  Y    N               Y    N

    日本酒 S  10  3         10  3
           Y   7             7  1(a) 6(b)   日本酒 Y 1(a) 6(b)
           N                 3  2(c) 2(d)          N 2(c) 2(d)

Step 3) 回答者数の行と列を除くと、「飲む」「飲まない」だけのクロス表になる
イェーツの連続修正(イェーツの補正) Yates' continuity correction

データ数 < 5 → χ2計算時行う補正
Ex. χ2 = 10 × (1 × 1 − 6 × 2 + 10/2)2/(7 × 3 × 7 × 3) = 0.8163
rc = 0.2857
0.25 < rc < 0.5 → 関連性基準より"やや弱い相関がある"

表. 酒類各組合せχ2値と独立係数。(表右上半分はχ2値、左下半分は独立係数)
                日本酒  ウィスキー  ビール  その他
    日本酒                0.8163    0.9722  0.1786
    ウィスキー  0.2852              0.1389  0.1786
    ビール      0.3318    0.1179            1.4025
    その他      0.1336    0.1336    0.3750

[結論] 対象集団の10人の人達について
(日本酒-ビール)、(日本酒-ウイスキー)、(ビール-その他)の組み合わせにやや弱い相関
ビールを飲む人は、ウイスキーは選ばず、日本酒・その他の酒類、特にその他の酒類を選ぶ傾向強い

b ) 回答数比率: 回答者数の列を除いたクロス表作成 → 縦計横計一致し、直ちに独立係数算出可

各セルの比率が回答総数に対する比率で表せ、独立係数は、単1回答と同様に考え算出できる
すなわち、仮定Aにおける(ア)及び(イ)に相当するものは、
(ア') 各年代における酒類の飲用比率は、全年代を通じた比率と同じ
(イ') 各酒類における年代間の分布は酒類横計の分布と同じ

表. 年代と酒類のクロス表。()内期待度数
    酒類       日本酒  ウィスキー ビール  その他  酒類(横形)
    29歳以下   1(2.10) 1(0.90)    2(1.80) 2(1.20)  6 (30%)
    30-49歳    2(2.45) 2(1.05)    3(2.10) 0(1.40)  7 (35%)
    50歳以上   4(2.45) 0(1.05)    1(2.10) 2(1.40)  7 (35%)
    全体(縦計) 7 (35%) 3 (15%)    6 (30%) 4 (20%) 20(100%)

→ ずれの指標を各セルについて求める

表. 期待度数からのずれの度合
    酒類       年代 29歳以下  30-49歳  50歳以上     縦計
    横計              0.5762   0.0826    0.9806   1.6394
    日本酒            0.0111   0.8595    1.0500   1.9207
    ウィスキー        0.0222   0.3857    0.0576   0.4655
    ビール            0.5333   1.4000    0.2571   2.1904
    その他            1.1428   2.7278    2.3453   6.2159

カテゴリー数は、年代別が酒類より小さいので、n = 20、k = 3を式に代入すると、独立係数rc = 0.394
このデータを回答数比率で見た場合、年代と酒類の嗜好とは"やや弱い相関がある"となり、回答者数比率を用いた場合とでは、相関の程度に差が生じる

カテゴリーデータ(数量データ)の取り扱い
Ex. 香水3銘柄A、B、C に、「ご自身が使用するとすればどれを選びますか」という質問項目を用い、ある女性集団20名に対し行ったアンケート結果
表. 香水と選んだ女性の年齢
    香水                          年齢合計 人数 平均
    A     26 33 25 23 28              135    5  27.0
    B     35 30 40 43 38 36 33        257    7  36.7
    C     46 35 41 40 27 26 22 39     276    8  34.5

                                      668   20  33.4

香水銘柄により平均年齢差あり、香水に年齢による嗜好偏りがある。平均値同じでも「無相関」と判断できない → Ex. 30代集中銘柄と20代、40代に同数の嗜好者が集中する銘柄では、両者の平均値同じ
→ 年齢ばらつきを用い相関関係を調べる必要 Ex. レンジ

Def. テトラコリック相関係数 tetrachoric correlation coeffcient: クロス集計表での2変数の相関係数
仮定: 潜在的には連続値型
級間変動(グループ間変動) between-groups sum of squares, sb: カテゴリー間平均値の違いを示す指標

Sb = Σi=1nni·(xix)2, ni, 各級標本数。xi:: 各級平均値。x: 全体平均
全体の平均値と各カテゴリーの平均値が等しい → Sb = 0
Ex. Sb = 5·(27 − 33.4)2 + 7·(36.7 − 33.4)2 + 8·(34.5 − 33.4)2 = 290.7

級内変動(グループ内変動) within-groups sum of squares: 変量毎の変動幅バラツキ度合の指標

→ 大きさ: 各級の数量データと級の平均値との差の平方和をカテゴリーデータ全体についての総和

結論: 年齢幅小 → 銘柄-年齢関係強。各銘柄平均値が全体平均値より離れる → 銘柄と年齢の関係強
表. 平均値との差の平方和(偏差平方和)の計算
   A                 B                     C

  年齢  差の2乗     年齢   差の2乗        年齢 差の2乗

   26  (26-27)2  1   35  (36-34.5)2  0.3   46  (46-34.9)2 132.2
   33  (33-27)2 36   30  (30-34.5)2 44.9   41  (41-34.9)2  42.3
   25  (25-27)2  4   40  (40-34.5)2 10.9   40  (40-34.9)2  30.3
   23  (23-27)2 16   43  (43-34.5)2 39.7   27  (27-34.9)2  56.3
   28  (28-27)2  1   38  (38-34.5)2  1.7   26  (26-34.9)2  72.3
                     36  (36-34.5)2  0.5   22  (22-34.9)2 156.3
                     33  (33-34.5)2 13.7   39  (39-34.9)2  20.3

合計   S1 = 58           S2 = 111.4            S3 = 510.4

級内変動, Sw = S1 + S2 + S3 = 58 + 111.4 + 510.4 = 679.8
相関比(寄与率) correlation ratio, η2 = Sb/(Sb + Sw) → Sb = 0 → η2 = 0 (Min.), Sw = 0 → η2 = 1 (Max.)

級内変動小/級間変動大 → 相関強い
= 全体指標として、これらの変動和に対する級間変動の割合用いる

相関比の有意さは分散分析から検定されるが、目安は

η2_____相関___________関連
> 0.8___非常に強い相関__関連がある
0.8-0.5__やや強い相関___関連がある
0.5-0.25_やや弱い相関___関連がある
0.25 >__非常に弱い相関__関連はない

Ex. η2 = 290.7/(290.7 + 679.8) = 0.300 → 「年齢と銘柄にはやや弱い相関」

影響の有無の数値的扱い方

Ex. 健康影響評価
2値データによる比較(四分表): 比と差による比較(主に比) → 多カテゴリの検討、数量による検討

比較のための分割表(四分表, 2 × 2分割表、クロス表)


                 1 疾病あり(D)  疾病なし(D)  計
    曝露あり (E)      a            b         n1 (= a + b)
    曝露なし (E)      c            d         n0 (= c + d)
    計             m1 (= a + c) m0 (= b + d)

                 2 疾病あり(D)  人-時間
    曝露あり (E)      a            P1
    曝露なし (E)      c            P0m1 (= a + c) P (= P1 + P0)

健康影響を表す尺度(相対リスク, relative risk) → 使用は研究デザインに依存
リスク比 (risk ratio), φ = (a/n1)/(c/n0) = an0/cn1

発生率比 (率比 incidence rate ratio, rate ratio), R^R = (a/P1)/(c/P0) = aP0/cP1
オッズ比 odds ratio, φ^ = (a/c)/(b/d) = ad/bcφ
標本から得られた値 → 母集団について検討する際(一般化)、その値の精度が問題(誤差)
→ 信頼区間
リスク比: φ^exp[±z(α/2)V(logφ^)], α/2は標準正規分布上側α/2%点
率比: R^Rexp[±z(α/2)V(logR^R)]
オッズ比: φ^exp[±z(α/2)V(logφ^)], logφ^ ≈ 1/a + 1/b + 1/c + 1/d

相対リスク: 比としての解釈 → 参照referenceデータ不可欠

影響ありと判断する基準

インタビュー (interview)


目的
評価 (Ex. ジョブインタビュー)
情報収集
→ インタビュー者の口調・トーン重要
形式
構造化インタビュー: 統計的集計, 短時間

一問一答式の質問票(アンケート)調査に近い

半構造化インタビュー: 統計的集計・質的調査, 中時間

事前に大まかな質問事項を決め、回答者の答により詳細にたずねて行く簡易な質的調査法。長時間インタビュー行えない時などに効果的

非構造化インタビュー

質問内容を特に定めず、回答者が無意識な部分を引き出すのが目的
デプス(深層)インタビュー: 質的調査, 長時間
エスノグラフィックインタビュー: 質的調査, 長時間

現場で実際に対象物を使用してもらいながら行う

グループインタビュー

グループインタビュー: 統計的集計, 中時間

グループに対し質問票に記入してもらいつつ、会話から得る意見も収集 → 個人より集団としての消費者行動などの把握に適

フォーカスグループインタビュー: 質的調査, 長時間

1課題でグループ討論 → 安心感や連鎖反応起こりやすく、インタビュアーから直接質問されないため自発的コメント取りやすい

コジョイント分析 conjoint analysis

Ex. アンケート調査: 商品選好尋ねる → 好きな順番(順序変量)尋ねると被験者は答え易い

個々要因効果と同時結合尺度 conjoint scale を同時推定 (Ex. 好む商品と、その選好要因)

表1 Louviere(1990)によるコンジョイント分析の発展プロセス(Louviere 1990)
期: モデル (被験者の選好測定) → パラメータ推定法
  1. 公理的コジョイント測定法準拠モデル (序数尺度) → 単調回帰分析・線形計画法等の非計量的方法
  2. 線形加法モデル (序数尺度の変換値評定尺度) → 通常の最小二乗法
  3. 確率効用モデル = 選択基準コジョイント (選択確率) → ロジット回帰分析
フッター