Humor study オリジナル論文㉖

Cindy Vu. et al. Gendered Differences in Teaching Performance Evaluations of Obstetrics and Gynecology Residents. Journal of surgical education. 2021.

Methodologyはわからないけれど、Mixed methodsだった。

Abstract

目的:教育業績評価は、キャリア形成や昇進のために一般的に用いられている。その際、ジェンダー的な期待から、学習者が記入する評価には暗黙的あるいは明示的なバイアスが生じる可能性がある。本研究では、医学部3年生が研修医の性別に基づき、産科・婦人科研修医の指導能力をどのように評価したかを調査した。
設定:本研究は、ウィスコンシン州ミルウォーキーのウィスコンシン医科大学にて実施した。
デザイン:このレトロスペクティブなミクスドメソッド研究は、産婦人科の研修医の指導能力評価を調査した。2010年から2018年までの産婦人科研修医が、医学部3年生によって記入された。数値スコアの比較には、2標本両側 t 検定を使用した。コメント文の演繹的内容分析では、以下のカテゴリーに焦点を当てた:ポジティブまたはネガティブな代理人的(agentic)または共同体的(communal)な態度と特性、指導スキル、性格とプロフェッショナリズム、指導能力、人格と専門性、指導力、臨床能力と知識、研修医を表現するために使用された単語やフレーズの頻度などである。
結果:83名の研修医(女性71名、男性12名)のうち、男女間の教育業績評価得点に統計的な有意差は認められなかった(n = 10,753、評価完了総数)。女性研修医は男性より低く,男性は4点(5段階評価,5=優れている)以下にはならない傾向があった.また3,813件のコメントのうち、男性研修医の方が肯定的なコメントが多く、共同体の特性において統計的に有意であった(男性71.4%、女性53.9%、p = 0.01)。女性研修医の方が否定的なコメントが多く、共同体特性について、統計的に有意であった。(女性7.5%、男性2.8%、p = 0.01)。言葉の頻度では、男性の方が「目立つ」特徴(「優れている」「優秀」「模範的」)、「能力」用語(「知的」「明るい」「才能」「賢い」)が多く、「楽しい」「面白い」「ユーモア」と思われることが多いことが示された。女性研修医は、”思いやり “の言葉(”優しい”,”思いやりがある”)で表現されていた。
結論:学生が記入する教育業績評価は、教育スキルの貴重な評価であり、診療科の評価、賞の分配、フェローシップや雇用の機会に影響を与えるものである。本研究では、医学生が女性研修医を評価する際に、男性研修医とは異なる評価をすることが明らかになった。ジェンダーの期待を理解することは、男性と女性の医師評価の相違に対処する方法を見出すのに役立つと思われる。

INTRODUCTION

医療に携わる女性が増え、さらに産婦人科(OB/GYN)では急増しています。2015年には、OB/GYN研修医の83%が女性になっています。このような成長にもかかわらず、女性は指導的地位において十分に代表されておらず、生産性を調整した後でも男性よりも報酬が低い。この不一致の説明として提案されているのが、医師の評価方法です。教育評価は、雇用、昇進、定着に関する意思決定に広く利用されており教育スキルの有効な評価であることが分かっている。効果的な教師の資質は、一般的には、熱意、臨床能力、学生の受け入れ、学生の限界の認識、患者への感受性と特定されています。しかし、固有のバイアスが存在し、行動の評価に影響を及ぼしている。
学生たちは、女性医師が自分たちの「温かくファジーな」期待に応えられないことに驚きと失望を表明しました。彼らは、医療環境は女性に「より真剣」であること、そして「より尊敬を集める」ために自分自身を「証明」することを求めていると認識していた。
女性は、共同体的な特徴、つまり温かさに基づいた特徴よりも、エージェント的な特徴、つまり能力に基づいた特徴について、より否定的なフィードバックを受けた。男性優位の外科専門分野では、女性はジェンダーに基づく期待に従わないため、あまり好意的に見られない可能性がある。産婦人科の研修医を評価する学生の研究では、優秀な教師は、男性の性別、年齢、以前の仕事経験と関連していることがわかった。ジェンダーに基づく期待や学生による評価に関する研究のほとんどは、教員や定量的データに焦点を当てたものであった。本研究の目的は、医学部3年生が性別に基づき、産婦人科研修医の指導能力をどのように評価するかを明らかにすることである。

METHODS

このレトロスペクティブな混合法研究は、ウィスコンシン医科大学(MCW)の3年生医学生が記入したすべての産婦人科研修医指導実績評価を分析したものである。
ウィスコンシン州ミルウォーキーにあるウィスコンシン医科大学(MCW)で、3 年生が記入したすべての産婦人科医教育業績評価を分析した。この中規模医療機関の医学生は、3年次のコアローテーションの一部として、6週間の産婦人科クラークシップを修了することが義務付けられていた。3つの病院に分かれ、医学生は主に産婦人科の研修医と関わり、指導を受ける。6週間のクラークシップの終わりに、医学生は交流のあった研修医に対する教育業績評価を何度でも行うことができた。医学生は、この評価を匿名でOASISを通じて提出しました。OASISは、教育機関が有効な評価を行うために設計されたWebベースのアプリケーションであり、教務部が監視・管理しています。
この評価は、他のすべてのクラークシップで利用されており、研修医の指導効果に関する質問を5段階評価(5=優れている、1=悪い)で行っています。 本研究の目的では、以下の質問に対する回答を評価した。

  • 研修医は、どの程度、メンターやロールモデルとしての役割を果たしましたか?
  • 研修医はどの程度、教育や学習に対して積極的な態度を示していましたか?
  • 研修医は、チームリーダーとして、どの程度、学習環境を整備していましたか?
  • この研修医に対するあなたの総合評価

このプロジェクトは、Medical College of Wisconsin Institutional Review Board の承認を得ている。データセットには、研修医名、研修医性別、卒後年次、評価点数、評価コメント文が含まれる。教育業績評価は学生によって匿名で記入されたため、データセットには、学生を特定できるような識別情報や属性(例:性別、年齢など)は含まれていない。研修医の身元を保護し、研修医の性別を査読者に知らせないために、研究スタッフは、研修医の名前とすべての性別の代名詞をデータセットから削除した。各項目は、次の比較分析のために数値で識別された。この期間中に行われた産婦人科医に対するすべての教育業績評価が含まれる。統計解析は、評価の数値に目に見える性別の偏りがあるかどうかを判断するために行われた。統計解析を行い、評価点数に明らかな性別の偏りがあるかどうかを調べた。機関要件の一部として、医学生はローテーション割り当てごとに少なくとも1つの研修医指導評価を完了することが期待されており、完了すべき指導評価の上限はない。そのため、医学生は希望する数だけ評価を行うことができた。学生の匿名性のため、研究期間中の各研修医は、同じ数の評価を受けることはなかった。評価の数値得点に関する男女間の差の検定には、当初、両側Mann Whitneyを使用した。しかし、サンプル数が少ないため、2標本の両側t検定も使用された。満足または同意のスケールの閾値は5段階評価で4とした。この場合、比較にはフィッシャー正確検定が用いられた。すべての統計解析は、IBM SPSS 25.0 (SPSS Inc., Chicago, IL) を用いて行った。帰納的内容分析から始め、個々の産婦人科研修医に提供されたすべての書面による評価コメントを検討した。3人の著者(CV、RF、KK、いずれも女性)が、データのサブセットに対してオープンコーディングを独自に行い、カテゴリーを作成し、記述されたコメントの正確な理解を確認した。チームメンバーで話し合い、相違点を調整し、コードブックが作成された。このコードブックには、次の4つの主要なカテゴリーが含まれていた。(1)指導力、(2)人格と専門性、(3)指導力、(4)臨床力と医療知識。そして、各チームメンバーが独立して、この4つのテーマの中で評価を集中的に演繹的にコーディングし、コメントの価値が肯定的か否定的かを識別した。また、コメントはエージェント的な態度や特性に焦点を当てているのか、それとも共同体的な態度や特性に焦点を当てているのか、そしてそれらが肯定的なのか否定的なのかを判断するために評価されました。この内容分析は、過去に文献で報告されたagenticとcommunalの用語に基づいたものである。チームメンバーは分析中も定期的に連絡を取り合い、2回にわたって疑問点や誤解の可能性を確認するためのメンバーチェックを行いました。これらの合意形成の場は、不確実性を明確にし、分析の厳密性をより確かなものにした。すべての質的データは、NVivo 12定性分析ソフトウェア(QSR International Pty Ltd)を用いてコード化、整理、保存され、単語やフレーズの頻度の測定にも使用された。特に、「目立つ」、「能力」、「砥石」、「対人関係や思いやり」については、過去の文献をもとに頻度を決定しました。これらの用語は、同僚と自分を差別化する能力、スキルや知識、仕事に対する意欲や努力、労働倫理と効率性、そして対人能力に関連するものである。すべてのデータがコード化され、分類された後、数字で識別された項目は、研究スタッフが持っているキーと照合され、居住者の性別が判明しました。男性・女性の結果を比較し性別による差異を評価しました。

RESULTS

2010年から2018年にかけて、83名の産婦人科レジデント医師(女性71名、男性12名)は、産婦人科クラークシップをローテーションする医学生が記入した10,753件の指導実績評価を受けた。このうち、3,813 件の評価にはコメントも含まれていた。

Quantitative analysis results

定量結果のデータは、平均値、標準偏差、最小値、最大値でまとめました(Fig.1)。平均値は、測定値を持つすべての研修医について算出した。男性研修医と女性研修医の教育業績評価得点に統計的に有意な差はなかったが、一貫したパターンが現れた。女性研修医は男性研修医より低いスコアを示す傾向があった。特に、3名の女性研修医(10、21、46)は平均点を大きく下回った。男性では、5段階のリッカート尺度(5=優れている)で4点未満になることはほとんどなかった。男女とも、研修年数が長くなるにつれて成績は低下する傾向があった。医学生の得点は一貫していた。すなわち、低得点の研修医は4つのカテゴリーすべてでそうであった。

Qualitative Analysis Results

医学生から提出された総評価コメント3,813件のうち、231件(約6%)は、「素晴らしい研修医」など、内容が曖昧なため除外された(図2)。
全体として、男女ともに否定的なコメントよりも肯定的なコメントが多かった。コメント内容としては、入居者の指導スキルや共同生活での態度や特徴に関するものが多く見られました。すべてのカテゴリーで男性の方が肯定的なコメントが多かったが、共同生活者の特徴だけは統計的に有意であった(男性71.4%、女性53.9%、p=0.01)(図3)。女性研修医は、臨床スキルと知識を除くすべてのカテゴリで否定的なコメントが多かったが、共同体特性のみが統計的に有意であった(女性7.5%、男性2.8%、p = 0.01)(図4)。使用した言葉の頻度から、医学生は男性研修医を「目立つ」特徴(「最高」、「卓越」、「優秀」、「模範的」など)や「能力」用語(「知的」、「明るい」、「才能」、「賢い」など)がより多くあると表現していることがわかった。女性居住者は、”思いやり”(”親切”、”思いやり “など)の表現が多い(表1)。
全体的に、女性研修医を表現する言葉として最も多かったのは「親しみやすい」、男性居住者を表現する言葉として最も多かったのは「優秀」であった。男女とも上位3位には「素晴らしい」「親しみやすい」が含まれていますが、女性を表す言葉として3番目に多いのは「親切」、男性は「最高」でした(表2)。男性研修医は、「メンター」「ユーモア」「楽しい」「面白い」と呼ばれたり、表現されたりすることが多いようです。女性では、「リーダー」、「ロールモデル」、「お気に入り」。特に、「笑顔」については、女性の方が多く寄せられています(表3)。男性のみを表す言葉としては、「信頼できる」(n=1、0.2%)が挙げられた。女性のみを表す言葉はいくつかあり、その多くは否定的、または共同的なものであった。特に、「苛烈」、「冷たい」、「きつい」、「毒舌」といった言葉が使われていた(表4)。

DISCUSSION

評価点には、統計的に有意な差は見られなかった。この結果は、男性の数が少なかったためと思われるが、男性の方が評価が高く、リッカート尺度で4(非常に良い)未満になることはほとんどなかった。評価に関する研究では、評価のわずかな違いが受賞の大きな違いにつながるという「増幅カスケード」が明らかにされています。また、差が出ないということは、ジェンダーバイアスを捉えられないということであり、ネガティブな結果はジェンダーバイアスを否定するのに不十分であると考えられます。
コメントは、教える技術や共同体傾向に焦点が当たっており、学生は、指導力、専門性、人格を備えた知識豊富な臨床医としての研修医よりも、教育者としての研修医を高く評価していることが示唆される。臨床能力と知識を除くすべての項目で、男性の方が肯定的なコメントが多く、女性の方が否定的なコメントが多いことが示された。しかし、共同体としての特性の違いだけが、両方の価値観で統計的に有意であった。このように、性別によるステレオタイプに合致する女性がいる一方で、それに反する女性も存在し、その場合、あまり好意的に見られない可能性がある。「目立つ」「必死に働く」「能力」「思いやり」の言葉の頻度を評価すると、男性では「目立つ」「能力」が多く、女性では「思いやり」が多く記述されており、女性は男性ほど能力がない、または抜きんでていないことが示唆されました。同様の結果は、救急医療研修医の評価を調査したBruckerらにも見られ、試験やマイルストーン評価に差がないにもかかわらず、女性研修医は「能力」「必死に働く」の否定的なコメントが多く、男性は「必死に働く」の肯定的なコメントが多いことが分かりました。
この研究で評価された言葉のうち、女性を表現する言葉として最も多かったのは「親しみやすい」という共同体の言葉であり、男性を表現する言葉として最も多かったのは「優秀」というエージェント的で「目立つ」言葉であった。この2つが両者を表す言葉のトップですが、3番目に多い言葉には違いがありました。女性は “helpful “で、これも共同的で、男性は “best “で、これも “standout “である。「メンター」、「ユーモア」、「楽しい」、「面白い」と表現されるのは、男性の方が多かったです。女性は「リーダー」「ロールモデル」「お気に入り」と表現されることが多く、「笑顔」についての言及が多い。例えば、”満面の笑み”、”もっと笑って、親しみやすくする必要がある “など。女性の性格や笑顔について言及することは、彼女の能力を貶め、社会的な価値の指標として外見が使用され続けていることを暗示しているのです。最近の研究では、ユーモアがパフォーマンスやリーダーシップの評価と関連していることが示唆されており、男性が表現するユーモアは機能的で、女性が表現するユーモアは破壊的と見なされています。

今回の結果では、男性のみを表す言葉として、「信頼できる」という言葉がありました。一方、女性に対しては、”苛烈”、”冷たい”、”厳しい”、”毒々しい “などのネガティブな表現が多く見られました。あまり使われないが、これらの言葉はかなりのダメージになる。さらに
専門的な意味合いに加えて、これらのコメントは、自己不信の増大、臨床家としての自信の欠如、燃え尽き症候群、うつ病につながる可能性があります。
本研究の強みは、産婦人科研修医に対する学生の評価を、厳密な内容分析と研修医の性別とコメントや評価点との関連性を見えなくする工夫により、定量的・定性的に徹底的に検討した最初の研究であることである。この研究は、女性医師が多い外科系診療科を評価したものです。膨大な年月のデータを分析した。すべての研究において、男性研修医の数が少ないという限界を明らかにしなければならないが、この不均衡は、全国の産婦人科プログラムを代表するものである。評価書の提出が匿名であったため、学生の属性は不明であった。研究者全員が女性であり、仮説の盲検化がなされていないため、解釈は研究者の視点によって形成されている。学生が記入する教育業績評価は、教育スキルの貴重な評価であり、学科での評価、賞の分配、将来の雇用機会に影響を与える可能性がある。本研究では、産婦人科の女性研修医は、3年目の医学生が記入する評価において、男性研修医よりも低いスコアを示す傾向があることを明らかにした。また,男性にはより肯定的な,女性にはより否定的な共同体的特徴があることが,ジェンダー的な期待に影響されている可能性がある.男性は「目立つ」「能力」という言葉で表現され、女性は「思いやり」という言葉で表現されることが多かった。我々の研究は、産婦人科が女性医師の多い外科系分野であるにもかかわらず、ジェンダーバイアスが依然として蔓延していることを示している。今後の研究では、学生の性別を分析するフォーカスグループや、男性・女性の研修医や教員に関する期待のパターンを分析が含まれるだろう。ジェンダーの期待を理解することは、医学教育全体にわたってフィードバックを提供し、書く方法を改善するのに役立つと思われる。

Translated with DeepL

私見

男性の方がHumor orientedとは、今までの知見と一致するな~。

Mixed methodとは定量と定性のミックスなのはわかるのだが。定量の方は明らかに多重解析の気がするのだがいいのかな?Grindstoneは砥石なのだけれど、ハードに働くことという感じかな?Methodologyはフェミニズムになるのかしら?(木原先生の質的研究の本にはそうあるんだけど。。。自信なし)

もう一本、Mixed methodがあるので見てみよう!

コメント

タイトルとURLをコピーしました