妥当性

  • 客観性
  • 信頼性の向上

定義

妥当性は、テスト手順が測定するように設計された機能を実際にテストする精度として定義されます。 つまり…テストが測定すると主張しているものを正確に測定する程度。 したがって、妥当性は品質の重要な科学的基準です。

答えられるべき質問は次のとおりです:テスト/測定手順で実際に何が測定されますか? テストは実際に何を測定するかを正確に測定しますか? 前提条件:何を測定するかを事前に明確にする必要があります(能力または構成の定義)。

トレーニング中-科学 パフォーマンス診断、最初のXNUMXつの形式の妥当性、特に基準の妥当性が主な関心事です。

  • 論理的議論(内容の妥当性)
  • 基準との相関関係の決定(基準の妥当性)
  • 類似性との相関関係の決定(契約の有効性)

コンテンツの有効性は、有効性が経験的調査からではなく、理論的または論理的な考慮事項から推測される場合に与えられます。 1)見かけの妥当性:コンテンツの妥当性は、十分に根拠のある妥当性の推定に基づいています。

だから…テストは、実際にそれに合う能力をテストしているという印象を与えます。 特性との一致が非常に明白である場合、論理的または些細な妥当性についても話します。 たとえば、(射撃力の決定としての16 mのラインからのサッカーでのショット、またはバスケットボールの投球精度の決定としてのフリースローラインからのフリースロー)。

2.専門家による評価:内容の妥当性が明らかでない場合は、有能な人物によるさらなる調査が必要です。 テストは、内容に関して有効であると明確に判断することはできません。 それは最初に専門家の意見によって確認されなければなりません。

専門家の評価は、専門家のコンセンサスとして理解されています。 妥当性を判断する際の専門家による評価の手順:80%を超える合意に達した場合、コンテンツの妥当性は肯定的であると見なされます。 注意!

(コンテンツ関連の妥当性の問題)

  • 選択された専門家は、テストがテスト対象の機能をチェックするかどうかを書面または口頭で尋ねられます
  • 専門家は質問票を受け取り、テスト中に決定されるスキルにチェックマークを付ける必要があります。
  • 測定器は常にいくつかの能力やスキルを並行してテストし、テスト実行の技術的な違いが結果を改ざんする可能性があります
  • 機能的変動(同じテストで、異なる被験者の異なる特性をテストする場合があります。腕立て伏せ(強度)など 耐久性 対さまざまなパフォーマンスレベルでの最大強度)