項目とは?

珍項目はウィキペディア上にある項目で百科事典としての体裁(正確性、簡潔な文章、中立性など)を保ちつつも、読み方によってはどことなく珍妙さやユーモアなどを感じさせる文章を備えたものをリストにした物です。従って虚偽や無意味な冗談などの記述を持った「削除された悪ふざけとナンセンス」の記事群とは大きく趣を異にしています。
リストされている項目が珍項目にふさわしいかどうか疑問があれば「珍項目の再選考」にかけることができます。
現在、ウィキペディア日本語版全体で438,187本の記事があり、そのうち170本の記事が珍項目に選ばれています。
ここは Wikipedia:珍項目 にふさわしい項目を選考する場です。可否は投票によって決定されます。投票または推薦の前にルールに一通り目を通すようお願いします。ルールについてのご意見はこのページのノートにどうぞ。
いつでも(ただし範囲内において)誰でも、珍項目にふさわしい項目を推薦できます。ログインユーザであるか、IPユーザ(ログインしない利用者)であるかは問いません。
上は推薦者自身が賛成の場合ですが、中立なら「(コメント)」、反対なら「(反対)」を「(賛成)」の代わりに書いてください。この賛成・反対は、推薦者自身の投票を兼ねます。ただし、IPユーザができるのは「(コメント)」のみです。
投票で不採用となった候補も、加筆・修正、または議論を経れば、再推薦できます(推薦理由をコメントに明記してください)。
投票期間は、推薦から1週間(168時間=翌週の同曜日同時刻まで)です。これを超えての投票は無効です。
推薦者は、投票期間終了後なるべく速やかに集計してください。ただし、投票期間が終わっていれば誰でも集計して構いません。
採用の候補は Wikipedia:珍項目#リスト に追加してください。その際「編集内容の要約」欄に項目名・賛成票数・反対票数を記入してください。またリスト冒頭の記事数も修正してください。
賛成票が反対票の3倍以上かつ3票差以上あり、かつ、その状態が24時間前から現在まで継続している候補は「早期通過」として採用することができます。
(賛成)マーハン・カリミ・ナセリの様な、制度に因って振り回され意図せず奇人になってしまった人間として。--釣本直紀 2007年11月19日 (月) 13:01 (UTC)
(コメント)珍と言うより社会問題。珍項目の枠で扱うべきか悩ましい。故に否定も賛成もせず。--夜飛(話/歴) 2007年11月21日 (水) 13:15 (UTC)
(賛成)おかしな発明をした人間として。発明品の概略も載っており初見の人にも珍妙さが伝わり易い。--釣本直紀 2007年11月19日 (月) 13:01 (UTC)
(反対)怪人物ではあるが評価が難しい部分もあり、記事自体も扱いかねている様子が偲ばれる。項目として珍なのではなく、当人が珍というか評価不能なだけ。ちなみに記事名称は中松義郎が正式であり、あえてリダイレクト項目名で扱うのも不適切なんじゃないかと。--夜飛(話/歴) 2007年11月21日 (水) 13:09 (UTC)
(コメント)疑似科学で片付けられないトンデモな発見をした人物として。面白い人間だが項目は説明がやや足りない。--釣本直紀 2007年11月19日 (月) 13:01 (UTC)
(反対)定義未満というか、そもそも同人物が何なのかよく判らない。まあ変っつっちゃえば変なんだけど。--夜飛(話/歴) 2007年11月21日 (水) 13:15 (UTC)
(コメント)あまりにも直感に反する内容のせいでパラドックス呼ばわりされている歴とした定理。--Kyoku 2007年11月21日 (水) 12:50 (UTC)
ここは Wikipedia:珍項目 に掲載されている項目が、真に珍項目にふさわしいかどうか再び選考する場です。ログインユーザだけが参加できます。
ただし(賛成)(反対)の代わりに(除去)(維持)です。(コメント)も使えます。早期通過はありません。
除去票が維持票より多ければ Wikipedia:珍項目#リスト から除去してください。その際「編集内容の要約」欄に項目名・除去票数・維持票数を記入してください。
(除去)--三谷幸喜が脚本を書いたテレビドラマの世界限定のお話で、そのドラマに詳しい人間以外には意味が通じない。釣本直紀 2007年11月19日 (月) 13:01 (UTC)
(存続)日本版マクガフィンの一例で刑事コロンボの「かみさん」にも匹敵する。いわゆる羅列記事ではあるが、その各々が共通スタイルで端的にまとめられており、可読性も悪くない。百科事典的なスタイルとしても申し分なく、その一方でおそらく紙製百科事典には存在しないあからさまに奇妙な珍項目。珍項目の選択基準にも沿っている。--夜飛(話/歴) 2007年11月19日 (月) 13:20 (UTC)
(除去)少なくとも概要部分においては、項目列挙型の記述は改められるべき。--КОЛЯ 2007年11月19日 (月) 18:58 (UTC)
(除去)--『一般の百科事典では見つからないような項目』、『ふつうに考えてあり得ない事柄をあつかった項目』のどちらの条件にも当てはまらない。極真面目な記事に見える。釣本直紀 2007年11月19日 (月) 13:01 (UTC)
(除去)2006年8月の選考中の編集により既に珍でなくなっていると思います。参考・当時の選考--КОЛЯ 2007年11月19日 (月) 18:58 (UTC)
(除去)--ただの2ちゃんねる用語。他の2ちゃんねる用語と比べて特異ではない様に見える。釣本直紀 2007年11月19日 (月) 13:01 (UTC)
(維持)「一般の百科事典では見つからないような項目」であり、綴りのインパクトは他の2ちゃんねる用語等のインターネットスラングの中で圧巻である。是非残しておきたい。--КОЛЯ 2007年11月19日 (月) 18:58 (UTC)
(除去)--単に子供向け番組でよくある展開、というだけで珍しくは無い。釣本直紀 2007年11月19日 (月) 13:01 (UTC)

[ 79] Wikipedia:珍項目 - Wikipedia
[引用サイト]  http://ja.wikipedia.org/wiki/%E7%8F%8D%E9%A0%85%E7%9B%AE

○ 利用者調査は、第三者である評価者が、利用者へのアンケートや対面聞き取り調査等を実施し分析する等の方法により、現在の利用者のサービスに対する満足度を把握する手法である。この手法を用いることで、利用者の、より率直な意見や要望を把握することができる。
○ 事業評価は、第三者である評価者が、所定のプロセスに沿って事前調査及び訪問調査を実施し、利用者からは見えにくい事業のしくみやサービスの提供プロセスを、次の二つの視点から判断・分析すること等の方法により行う。
現在提供されているサービスの質を評価するために、第三者がサービス提供のプロセスを評価する。
安定的に良質なサービスが提供できるような体制にあるかどうかを評価するために、事業者の経営や組織のマネジメントを評価する。
○ 平成12年度、13年度に行った、評価手法の検討、調査票の作成、試行、検証作業は、以下のとおりである。
○ 12年度は、「東京都サービス評価制度検討委員会」において、高齢者福祉分野のサービスを、「地域福祉サービス評価システム検討会」において、保育・障害者福祉分野のサービスを対象にして、利用者調査の検討と試行を行った。具体的な対象サービスは、次のとおりである。
○ また、13年度においては、「福祉サービス第三者評価システム検討会」の下に、高齢、保育、障害各分野別に分科会を設置し、検討対象サービスを拡大して、以下の目的で検討と試行を行った。
○ 各分科会は、次のような共通の枠組みに沿って、それぞれのサービス特性を踏まえて、検討を行った。
12年度に利用者調査の検討・試行を行ったサービスについて調査票の項目数を絞り込んでいくこと
各サービスについて、施行後、共通評価項目につながる、重要と思われる評価項目を抽出 すること。
コミュニケーション能力が十分でなく、アンケートや聞き取り調査では意向を把握できない利用者に対する調査手法を検討すること。
○ それぞれのサービスの試行結果から、重要と思われる評価項目を抽出するにあたっては、次のような定量的な分析や定性的な分析などいくつかの方法を組み合わせて行った。
利用者調査では、現在そのサービスを利用している人がどのような点を重視しているかを理解するために、満足度構造分析を行った。
満足度構造分析で抽出された項目を検討して、利用者の選択にも役に立つと思われる項目をサービスごとに10から15項目あげ、重要と思われる項目抽出の参考とした。
1)総合満足度に対する大項目(利用プロセス)の影響の強さ、 大項目に対する小項目(サービスのポイント)の影響の強さをそれぞれ算出。
2)それぞれの項目の満足度への影響の強さと現状の評価とを組み合わせ、次の4種類の性質をもつ項目を抽出。
3)職員にも利用者と同じ調査票を用いて、利用者の気持ちになって回答するという調査を行った場合は、その評価差を、利用者と事業者の認識のギャップとし、ギャップの大きい項目をギャップ項目とする。
判断能力の程度に幅があり、コミュニケーションが困難な利用者が多いサービスで、回答数が少なく、定量的分析になじまないなどの場合、いくつかの判断基準を設け重要と思われる項目を選定した。この際の判断基準には、以下のようなものがあげられる。
他の方法では判断ができず、利用者本人から直接聞かないとわからない項目、あるいは本人に聞いたほうがより効果的な項目
知的障害者入所施設などでは、抽象的な内容の質問は利用者が理解しにくい、時間や曜日に関わる内容では正確な回答が得られにくいなど、質問として成り立ちにくい要素を持つ項目は重要項目から除く
対象者の回答率が低い項目、あるいは対象者全員が「はい」と答えがちな項目は満足、不満足を把握する質問としての重要項目から除く
組織経営を全体的にみる8つのカテゴリーを作成し、各カテゴリーの下に、2〜4の大項目を設けた。大項目はカテゴリーをみるための切り口の一つである、一般企業の組織のマネジメントを評価するための手法を応用した。
その中で、カテゴリー6「サービス提供のプロセス」は、直接的に利用者に関わる部分であることから、8つの大項目とその下にチェック項目を設けた。また、各チェック項目の実施状況を評価するために、各チェック項目の下に3〜8程度の確認事項を設定した。
事業評価分析シート・・事業者の組織経営のしくみやマネジメントの状況を把握するための調査票。8つのカテゴリーの大項目の評価を記入する。
サービスチェックリスト・・カテゴリー6「サービス提供のプロセス」のチェック項目を確認するための調査票。
○ 事業評価分析シートの作成にあたっては、一般企業の組織のマネジメントを評価するための手法を応用したため、調査票を作成するにあたっては、次のような点に留意した。
カテゴリーの表現や、カテゴリーの中の大項目の数あるいは大項目の表現は、福祉サービスの現状に即したものに置き換えた。
各大項目を5段階で評価することとしたが、評価をつけやすくするため、評価5と評価1のイメージを記述した。
事業者の取り組みは必ずしも意識されて行われているとは限らず、聞き取り調査において評価者が質問をし、事業者が答えていくやりとりの中で明らかになる場合もある。そのため、評価の根拠を記載する欄を調査票に設けた
評価の根拠は、良いと思う点、改善が必要と思われる点の両方を記載して、総合的にみて、大項目の評価をつけるようにした。
初めてこの調査票を記入する場合、具体的に何を書けばよいのかがわかりにくいため、評価の根拠の例示も載せた。
事業プロフィールを事業者が記入( 参考資料(事業概要、パンフレット、年次計画等)添付)
事業評価分析シート、サービスチェックリストを事業者が記入 《事業者による自己評価》
事業評価分析シート及びサービスチェックリストの各項目に、評価を記載する欄と項目そのものの重要度(3段階)を記載する欄を設ける。
◇ カテゴリー6の大項目5「サービスの実施」のチェック項目のうち、利用者によいサービスを提供する上で大事な項目
各カテゴリー内で、第三者評価の評点平均が比較的低い項目や、第三者評価の事業者間格差の大きい項目を重要と思われる項目にする。

[ 80] 評価・手法 項目編1
[引用サイト]  http://www.fukushihoken.metro.tokyo.jp/shidou/hyouka/dai3/hyoka1.htm

水道水は水道法によって、「水質基準項目」が定められており、すべての基準項目で基準値に適合していなければなりません。さらに水質基準を補完する項目として「水質管理目標設定項目」があります。また、「衛生上必要な措置」として残留塩素の保持が規定されています。
水道水の安全性と利便性を考慮した基準値が設定され、水道の規模の大小を問わず、すべての水道が遵守する義務があります。その「水質基準項目」は下の2項目に分けられます。
生涯にわたって連続的に水道水を摂取しても、人の健康に影響が生じない水準を基として、安全性を十分に考慮して設定されたものです。
水道水として生活利用上(色、濁り、臭いなど)あるいは水道施設の管理上(腐食性など)障害が生ずる恐れのない水準を基として設定されたものです。
将来にわたり水道水の安全性の確保などに万全を期する見地から、「水質基準項目」に準じて、水道水質管理上留意すべき項目として目標値が設定されています。
水の清浄度を示す指標で、多量に検出される場合は病原性生物に汚染されている可能性が高くなります。
電池やメッキ等に使われます。河川水に検出されることはまれで、工業排水などの影響により河川で検出されることがあります。イタイイタイ病の原因物質として知られています。
温度計等に使われます。自然界では極微量に存在しています。有機水銀化合物は水俣病の原因物質として知られています。
半導体材料等に使われます。自然界では極微量に存在しています。工業排水などの影響により河川で検出されることがあります。
鉛管・蓄電池等に使われます。自然界でも広く存在しますが極微量で、工業製品中にも含まれ環境中に存在しています。
シアン化カリウムは青酸カリとして知られています。工業排水などの影響により河川で検出されることがあります。
窒素肥料、腐敗した動植物、生活排水、下水等の混入によって河川水で検出されることがあります。高濃度に含むと乳児にメトヘモグロビン血症をおこすことがあります。
自然界には広く存在し、地質や工業排水の影響により河川水で検出されることがあります。適量の摂取は虫歯予防の効果があるといわれますが、高濃度の摂取は斑状歯をおこすとされています。
火山地帯の地下水や温泉、工場排水などの混入によって河川水などで検出される事があります。金属表面処理剤、ガラス、エナメル工業などに使われています。
揮発性有機化合物。人工的に合成された化合物で、科学合成原料や塗料、ドライクリーニングなどに使用されます。土壌を透過しやすく地下水を汚染する物質として知られています。
原水中の有機物(フミン質:植物などが微生物によって分解されてできた有機物質)と、消毒で使用する塩素が反応することで生成されます。
原水中の有機物(フミン質:植物などが微生物によって分解されてできた有機物質)と、消毒で使用する塩素が反応することで生成されます。
トタン板、乾電池等に使われています。工業排水や亜鉛メッキ鋼管からの溶出により検出されることがあります。高濃度になると白濁の原因になります。
工場排水などの混入や、水処理に用いられるアルミニウム系凝集剤に由来して検出される事があり、高濃度に含まれると白濁の原因になります。電線や印刷インクなどに使われています。
自然界に広く存在する金属で、高濃度に含まれると着色(黄褐色・赤水)や異臭味、苦味の原因となります。
乾電池等に使われています。自然界に広く存在する重金属で、高濃度に含まれると黒い塊になり着色(黒色)の原因となります。
地質や海水、生活排水、工業排水などの影響で検出されることがあります。高濃度に含まれると味覚を損なう原因となります。
カルシウムとマグネシウムの合計量のことで、硬度が低いと淡白な味になり、高いと硬い味になります。高濃度に含まれると石鹸の泡立ちが悪くなります。
湖沼などで富栄養化現象に伴い発生する異種味の原因物質で、アナベナなどの藍藻類によって産生され、かび臭を発生します。
湖沼などで富栄養化現象に伴い発生する異種味の原因物質で、フォルミジウムやオシラトリアなどの藍藻類によって産生され、かび臭を発生します。
自然水中には存在しませんが、工業排水などの影響により河川で検出されることがあります。異臭味の原因となります。
水中に存在する有機物に含まれる炭素の総量のこと。炭素は有機物の主成分であるので、全有機炭素(TOC)は有機物汚染の直接的な指標となる。また、この値が小さいほど、水の味はよく感じられる。
pH7が中性、7より小さくなるほど酸性が強く、7より大きくなるほどアルカリ性が強くなります。酸性が強くなると、水道管の腐食につながる可能性があります。
水の濁りの程度を数値化したもので、水中に分散している微粒子の状態の程度をいいます。基準値以下では透明な水といえます。
鉱山排水や工場排水などの混入によって河川水などで検出されることがあります。活字、ベアリング、電極、半導体材料などに使われています。
鉱山排水、工場排水などの混入やニッケルメッキからの溶出によって検出されることがあります。合金、メッキ、バッテリーなどに使われています。
人工的に合成された化合物で、化学合成原料や塗料、ドライクリーニングなどに使用されます。土壌を透過しやすく地下水を汚染する物質として知られています。
他の塩素系溶剤の製造工程中に生成する有機化学物質です。香料、ラッカーなどに使われています。
揮発性有機化合物。人工的に合成された化合物で、化学合成原料や塗料、ドライクリーニングなどに使用されます。土壌を透過しやすく地下水を汚染する物質として知られています。
染料、有機顔料などとして使用される有機化学物質です。香料、火薬、染料などに使われています。
プラスチック添加剤(可塑剤)などとして使用される有機化学物質です。化粧品、染料などの溶剤に使われています。
二酸化塩素の原料または分解生成物です。二酸化塩素の使用に伴って処理水中に残留するおそれがあります。
農薬類主成分101種類の目標値と測定値の比の和で表示されます。取水上流で使用されている農薬を調査し測定しています。
水中に溶けている炭酸ガスのことで、水にさわやかな感じを与えますが、多いと刺激が強くなります。また、水道施設に対し腐食などの障害を生じる原因となります。
工業排水などにより特に地下水が汚染されることがあります。高濃度含まれると水に甘い匂いがすることがあります。
ガソリンのオクタン価を上げるために添加されていました。地下水から検出されることがあります。
水中の有機物量の指標で、汚濁の度合いを示します。し尿や工業排水などが混入した場合は消費量が高くなります。
臭気の強さを定量的に表す方法で、水の臭気がほとんど感知できなくなるまで無臭味水で希釈し、臭気を感じなくなった時の希釈倍数で臭気の強さを示します。
水が金属を腐食させる程度を判定する指標で、数値が負の値で絶対値が大きくなるほど水の腐食傾向は強くなります。
病原菌などによる汚染を防ぐため、水道水中に残してある消毒用塩素のことです。塩素は低濃度で病原細菌を殺菌でき、安全性が高く殺菌効果が持続できる薬剤です。

[ 81] 水質検査項目
[引用サイト]  http://www.water.saga.saga.jp/suisitu/suisitu3/suisitu04.htm

項目応答理論(こうもくおうとうりろん)または項目反応理論(こうもくはんのうりろん)、略称IRT (Item Response Theory; Item Latent Theory)は、評価項目群への応答に基づいて、被験者の特性(認識能力、物理的能力、技術、知識、態度、人格特徴等)や、評価項目の難易度・識別力を測定するための試験理論である。この理論の主な特徴は、個人の能力値、項目の難易度といったパラメータを、評価項目への正誤のような離散的な結果から確率論的に求めようとする点である。
IRTでは、能力値や難易度のパラメータを推定し、データがモデルにどれくらい適合しているかを確かめ、評価項目の適切さを吟味することができる。従って、試験を開発・洗練させ、試験項目のストックを保守し、複数の試験の難易度を同等と見なす(例えば異なる時期に行われた試験の結果の比較をする)ためにIRTは有用である。また、コンピュータ適応型テスト(Computerized Adaptive Testing)もIRTによって可能になる。
より古典的なテスト理論(素点方式、偏差値方式)と比べると、IRTは、試験者が評価項目の信頼性の改善に役に立つ情報を提供し得る、標本(受験者)依存性・テスト依存性にとらわれずに不変的に受験者の能力値とテスト項目の難易度を求められる、という利点がある。
日本では試験にIRTを用いるようになったのは最近のことであるが、欧米諸国では既に広く使用されている。
一般的なモデルでは、項目への離散的な応答(正誤など)の確率が、1つの人パラメータと1つ以上の項目パラメータによる関数であるという数学的な仮説に基づいている。 用いられる変数は以下の通りである。
項目iの難しさを表す実数値。一般的には各項目に50%の正答率を持つ被験者の能力値を基準として決められている。
基本的な考え方としては、人パラメータと、項目の難易度パラメータの差をとり、ロジスティック曲線に当てはめて、正答する確率を求めるというものである。例えば能力試験において、ある項目が被験者にとって非常に簡単であった場合、その正答率は限りなく1に近づき、逆にある項目が被験者にとって非常に難しいものであった場合、その正答率は限りなく0 (パラメータcを用いる場合はci)に近づく。
最も簡単な1パラメータロジスティック(1PL)モデル(ラッシュモデルとも呼ばれる)では、変数にθとbiのみを用いる。しかし適用のための条件は厳しくなっている。このモデルでは、項目iに正答する確率は次の式で与えられる。
2パラメータロジスティック(2PL)モデルでは、さらにaiを用い、各項目が評価にとってどの程度適正な判断基準であるかを変数に組み込む。このモデルでは、項目iに正答する確率は次の式で与えられる。
ここで、定数Dは1.701という値で、ロジスティック関数を累積正規分布関数に近似するためのもので、確率が関数の定義域(一般的に-3〜3)内で0.01以上異ならないようになっている。 なお、IRTモデルは当初は普通の累積正規分布関数が用いられたが、このように近似されたロジスティックモデルを使うことで、大きく計算を単純化することができた。
3パラメータロジスティック(3PL)モデルでは、多肢選択形式の場合において、適当に選択肢を選択しても偶然正答する確率ciを考慮に入れ、項目iに正答する確率は次の式で与えられる。
人パラメータは被験者の評価の対象となっている1次元的な特性の大きさを表す。この特性は因子分析の1つの因子に類似している。また、個々の項目や人は相互に独立であり、集合的に直交であると仮定されている。すなわち、ある項目の正誤は他の項目の正誤に影響せず、ある人の正誤は他の人の正誤に影響しないという仮定を置いている。
項目パラメータは、ある項目の性質を示す。項目パラメータが定まると、受験者がその項目に正答する確率piは各受験者の能力θの1変数のみを持つ関数になり、縦軸に正答率、横軸に能力値としたグラフが描ける。このグラフは項目特性曲線(ICC; item characteristic curve)と呼ばれる。 パラメータbは項目の難しさであり、この値は人パラメータと同じスケール上にある。パラメータaは項目特性曲線の傾きを決定し、その項目が個人の特性の水準を識別する程度を示す。曲線の傾きが大きいほど、項目の難しさと人の特性の大きさに差があるときに回答の正誤がくっきり分かれることを示す。 最後のパラメータcは、項目特性曲線の負の側の漸近線である。すなわち、これは非常に低い能力を持つ人がこの項目に偶然正答する確率を示す。
各項目は互いに独立であるという前提を置いているので、項目特性曲線は加法的である。よって、すべての項目特性曲線を足したものが求められる。これはテスト特性曲線と呼ばれる。
試験のスコアはこのテスト特性曲線によって求められる。テスト特性曲線はθの関数であり、T(θ)の値を受験者のスコアとする。よって、IRTによるスコアは従来の方法によるスコアと比べ、計算・解釈において非常に異なっている。しかし、ほとんどのテストにおいて、値θと従来のスコアとの(線形)相関関係は非常に高い(.95以上になることが多い)。したがって、従来のスコアに比べ、IRTのスコアのグラフは累積度数分布曲線の形に近くなる。
ここまでで示したモデルでは、1次元的な特性と、項目に対する正解・不正解のような2値のいずれかの応答を前提としていた。しかし、多値ラッシュモデルのように多値(例えば0:全く誤り 1:ほとんど誤り 2:概ね正しい 3:完全に正しい、の4値)をとるように拡張されたモデルや、多次元的な特性を仮定したモデルも存在する。
以上ではθ, ai, bi, ciの各パラメータが存在するものとして考えてきたが、それぞれの真の値は一般的に未知である。よって、離散的な回答からそれぞれの値を推定することもIRTにおける重要な問題である。
IRTの主な知見の1つは信頼性の概念を拡張したことである。伝統的に、信頼性とは測定の精度を示すものであり、真のスコアと観察されたスコアの誤差の比率など、様々な方法で定義される単一の指標で現される。古典的なテスト理論では、クロンバックのα係数などがテスト全体としての信頼性の指標を表すものとして知られている。しかしIRTによると、評価の精度はテストの成績の全範囲にわたって均一ではないことが明らかになる。一般的に、試験点数の範囲の端のスコアは、中央に近いスコアより多くの誤差を含んでいる。
IRTでは、項目・テストのそれぞれについて、信頼性の概念を置き換える情報関数 (Information Function)という概念が用いられる。例えばフィッシャーの情報理論に従って、ラッシュモデルの場合には、項目情報関数は単純に正しい応答の確率と不正確な応答の確率の積で与えられる。すなわち、不正確な応答の確率をqi(θ) = 1 ? pi(θ)で表すと、以下の式で与えられる。
従って、情報量が多いほど、測定の間違いがより少ない(被験者の能力の推定がより正確である )ことを意味する。
2PL, 3PLモデルでもほぼ同様であるが、他のパラメータも考慮に入る。2PL, 3PLモデルのための項目情報関数はそれぞれ以下の式で表される。
各項目は互いに独立であるという前提を置いているので、項目情報関数は加法的である。テスト情報関数は単純にその試験における各項目の項目情報関数の和で求められる。テスト情報関数は、古典的なテスト理論における信頼性の概念を置き換えるものになる。
この性質を用いて、テスト項目の適切性に理論的根拠を与えることや、ある目的に特化したテストを作ることが可能になる。例えば、ある合格基準点を超えるか超えないかのみで合格・不合格が結果として与えられる(実際の合格点は重要でない)テストを作るのに有効なのは、合格基準点の近くで大きい情報が得られる項目だけを集めてテストを作ることである。また、コンピュータ適応型テストのように、ある時点での回答状況に応じて受験者の能力値を推定し、次にその受験者の能力値周辺で大きな情報が得られる問題を出題するということも可能になる。
等化(equiting)とは、異なったテストの結果、異なった受験者に対してのテストの結果を、項目パラメータや被験者能力値に関係なく、共通の原点と単位をもつ尺度に変換することである。等化には、水平的等化、垂直的等化の2種類がある。
古典的なテスト理論においては、テスト依存性や受験者依存性がつきまとうので等化を実現することは困難であった。しかしIRTによる項目パラメータは不変的であり、理論的には等化の必要はない。しかし、実際には一定の定数によって、2つのテストの得点を同一尺度上に変換することがよく行われる。この手続きは以下の式で行われる。
θ'は等化された能力値で、α, βは等化定数と呼ばれている。またこのとき、項目パラメータは以下のように調節される。
等化定数α, βの推定には、共通の受験者または共通の項目が必要となる。そして、等化のための基準には回帰係数、平均値と標準偏差、項目特性曲線の特徴等が用いられる。
科学者が考案した項目応答理論は非常に複雑な手法で試験のスコアを算出する為、科学者以外には問題の難易度と項目応答理論による配点の高低の相関関係の理解は困難である。その為、項目応答理論は「仮説」を立てて理解されている。
問題の難易度が低い場合は配点が低くなり、逆に問題の難易度が高い(正答率が偶然に正答する確率と同一)場合も配点が低くなる関係がある
一部では、全問正解ではないにも関わらずスコア満点の場合がある為、配点が0点の問題の存在が「予想」されている。
また、一部では項目応答理論には配点の概念自体が存在しないとの「仮説」も提唱されている(その場合でも、正答数が同一として、どの難易度の問題の正答が多いかによるスコア高低の傾向が存在すると「予想」されている)。
この項目「項目応答理論」は、自然科学に関連した書きかけの項目です。加筆・訂正などをして下さる協力者を求めています。
カテゴリ: 書きかけの節のある項目 | 自然科学関連のスタブ項目 | 確率論 | 統計学 | 解析学 | 心理学 | 数学に関する記事

[ 82] 項目応答理論 - Wikipedia
[引用サイト]  http://ja.wikipedia.org/wiki/%E9%A0%85%E7%9B%AE%E5%BF%9C%E7%AD%94%E7%90%86%E8%AB%96



お気に入り



  • track feed
    • seo