Ⅰ. 서론
인간은 사회적 관계 속에서 정체성을 형성하며 우정을 맺고 유지하는 능력은 성인기의 삶의 질과 적응을 좌우하는 핵심적인 사회적 요인으로 여겨진다(Rose, Kelly & Raxter, 2021). 또한 인간이 타인과의 관계를 지속하기 위해서는 갈등을 조정하고, 타인을 신뢰하며 도움을 주고받는 상호기술이 필수적이다(McVilly et al., 2006). 우정을 맺고 또래 관계를 증진 시킬 수 있는 사회적 기술 훈련은 학령기에서 핵심적으로 다루어져 왔으나(López-Martín, García-Bermejo, & Sotillo, 2022), 성인기의 사회적 요구는 더욱 복잡해짐에도 불구하고 이에 대한 근거기반실제는 여전히 매우 제한적이다.
성인기에 접어든 자폐 스펙트럼 장애 개인은 청소년기에 비해 신체적·인지적으로는 성숙하더라도 사회적 관계를 형성하고 유지하는 능력에서는 여전히 상당한 어려움을 지속적으로 경험하는 것으로 보고된다(Orsmond, Krauss, & Seltzer, 2004; Reichow, Steiner, & Volkmar, 2013; Rho & Jung, 2023). 고기능 자폐스펙트럼장애 성인을 대상으로 한 선행 연구에서도 사회적 고립, 낮은 참여율, 제한된 우정 관계가 반복적으로 확인되었다(Cederlund et al., 2008; Orsmond et al., 2004). 이러한 사회적 결함은 취업, 독립생활, 친밀한 관계, 결혼 등 성인기의 핵심 발달 과제 전반에 부정적인 영향을 미치며 결국 삶의 질 저하로 이어진다(Bishop-Fitzpatrick, Mazefsky, & Eack, 2018; Howlin, Mawhood, & Rutter, 2000). 더불어 이러한 사회적 기능 결함은 자폐스펙트럼장애 성인에만 국한되지 않고, 지적 및 발달장애나 주요 정신 장애 성인 역시 유사한 대인관계에서 어려움을 보이며 사회성 기술 지원이 필요한 것으로 보고되고 있으며, 성인기 사회성 기술 지원의 필요성이 전반에서 강조되고 있음을 알 수 있다(Honan et al., 2022; Moe et al., 2021; Rose et al., 2021).
자폐스펙트럼장애 성인의 사회적 요구에 대응하기 위해 개발된 사회성 기술 훈련 가운데 하나인 PEERS®-YA (Program for the Education and Enrichment of Relational Skills for Young Adults, 이하 PEERS®-YA)는 성인기의 사회적 관계 형성 및 유지에 필요한 핵심 기술을 체계적으로 교육하기 위해 고안된 프로그램이다(Laugeson, 2017). PEERS®-YA는 대화를 시작하고 유지하기, 새로운 친구를 사귈 수 있는 곳 찾기, e-커뮤니케이션, 상황에 맞는 유머 사용하기, 그룹 대화에 자연스럽게 들어가고 빠져나오기, 함께 어울리기, 데이트 예절(호감 표현, 데이트 신청, 데이트하기, 데이트 과정에서의 기본예절 및 금기 행동), 논쟁 다루기, 직접·간접적 괴롭힘 다루기의 주제를 포함하여 총 16회기로 구성되어 있다(Laugeson, 2017). 더욱이 성인을 지속적으로 지원할 ‘소셜 코치’가 대상자와 동일 시간대에 별도의 교육 세션에 참여하여 대인관계 기술 지도 전략을 학습한다는 점에서 일반화를 촉진할 수 있는 구조적 강점을 지닌다. 이러한 PEERS®-YA는 고기능 자폐스펙트럼장애 청소년을 위해 개발된 PEERS®(Laugeson & Frankel, 2010)의 핵심 구성 요소-정규 세션, 행동 연습, 역할극, 사회적 코칭, 과제 수행, 그리고 부모 참여-를 성인기의 발달적 요구에 맞추어 확장·조정한 형태로 확립되었다.
UCLA PEERS® 공식 사이트에서는 PEERS®-YA가 18-35세 연령에 해당하는 초기 성인이 또래와의 친밀한 관계를 형성하고 유지하며, 필요한 경우 연애 관계로 발전시키는 데 필요한 사회적 기술을 익히도록 설계된 근거기반실제로 소개되고 있다. 하지만 현재까지 PEERS®-YA의 연구 방법론적 엄격성은 체계적으로 확립되지 않은 실정이다. 청소년 대상 PEERS®는 자폐증 근거기반실제 국가정보센터(National Clearinghouse on Autism Evidence and Practice, NCAEP)로부터 근거기반실제(Evidence-Based Practice)로 공인된 프로그램이지만(Steinbrenner et al., 2020). 성인을 위한 PEERS®-YA는 청소년기와 비교해 직업생활을 준비하고 독립적인 생활을 확립하며 연애 관계를 형성하는 등 사회적 발달 요구와 목표 영역에서 청소년기와 현저한 차이를 보인다. 더불어 최근의 국제 연구들은 PEERS®-YA가 대면·온라인 기반 운영, 다양한 인지·사회적·문화적 특성을 지닌 성인 집단에 따라 프로그램의 내용 등이 실제 적용되는 맥락에 따라 조정되어 왔음을 보고하고 있다(Howarth et al., 2023a; Moe et al., 2021; Oh et al., 2021; Platos, Wojaczek, & Laugeson, 2023). 이러한 변형 가능성을 고려하면, PEERS®-YA의 연구 동향을 살펴보는 과정은 단순히 자폐스펙트럼장애 여부나 연령 범위에 근거한 결과 해석을 넘어서 중재 실행의 충실도, 구성 요소의 적용 방식, 효과의 유지 및 일반화, 참여자 특성, 문화적 조정 여부를 포함한 구조적·다차원적 분석이 요구된다.
또한, 중재 연구가 현장에서 타당성 있게 적용되기 위해서는 질적 지표에 부합하는 질 높은 연구 수행이 중요하다(Cook et al., 2014; Gersten et al., 2005; Horner et al., 2005). 특정 연구가 근거기반실제가 되기 위해서는 높은 수준의 질적 평가가 필수적이며, 특수교육학계에서는 주로 미국 특수아동협의회(Council for Exceptional Children, 이하 CEC)와 전환지원 국가기술지원센터(National Technical Assistance Center on Transition, 이하 NTACT)의 질적 지표가 활용되어왔다. 특히 NTACT는 전환교육, 직업재활, 진로, 기술교육 영역을 중심으로 근거기반실제를 식별하고 보급하는 역할을 수행하는 기관으로(NTACT, 2018) 성인기 사회적 관계, 직업 적응, 지역사회 참여 등 전환과 직결된 목표를 직접적으로 다루는 PEERS®-YA의 평가에 적합한 기준을 제공한다. 따라서 특수교육 전반을 포괄하는 일반적 질 평가 기준보다는 전환 영역에 초점을 맞추어 개발된 질 평가 틀을 적용하는 것이 타당하다고 판단하였다. 이와 같은 이유로 본 연구에서는 CEC의 일반적인 질적 지표 대신 NTACT에서 제시한 질적 지표를 채택하였다.
이에 본 연구의 목적은 성인을 대상으로 실시된 PEERS®-YA 선행연구를 체계적으로 검토하여 연구의 일반적인 특성을 살펴보고 질적 지표를 토대로 연구 방법론적 엄격성을 평가하고자 한다. 연구 목적을 달성하기 위해 체계적 문헌 분석 가이드라인(Preferred Reporting Items for Systematic Reviews and Meta-Analyses, PRISMA)에 따라 문헌을 선정하고 각 연구의 일반적 특성과 중재 구성 요소를 분석하였다. 또한 NTACT(2021)에서 제시한 질적 지표를 적용하여 PEERS®-YA 연구 방법의 질적 수준을 종합적으로 평가하였다.
Ⅱ. 연구 방법
체계적 문헌 분석의 방법과 결과는 고찰 결과의 신뢰성과 적용 가능성을 평가할 수 있을 만큼 충분히 보고되어야 한다(Page et al., 2021). 본 연구는 성인을 대상으로 한 PEERS®연구의 일반적 특성을 체계적으로 분석하고 문헌 선정 및 보고의 신뢰성을 확보하기 위해 PRISMA 2020 지침을 적용하여 수행되었다. PRISMA는 체계적 문헌 분석 및 메타 분석의 보고 질을 향상시키기 위해 개발된 국제 표준 지침으로 문헌 검색에서부터 선택, 자료 추출, 분석 및 보고에 이르는 전 과정을 투명하고 일관되며 재현 가능하게 하는 것을 목적으로 한다(Page et al., 2021). 본 연구에서도 문헌 선정의 객관성을 높이고 연구의 질을 제고하기 위해 PRISMA 지침에 따라 체계적 문헌 분석을 수행하였다. 문헌 선정을 위해 PRISMA 2020 흐름도를 연구 목적에 맞게 재구성하였으며 흐름도는 <Figure 1>과 같다.
문헌 검색은 사회 및 행동과학 분야를 폭넓게 포괄하는 전자 데이터베이스(EBSCO, ProQuest, PubMed, RISS)를 활용하였다. 2025년 10월까지 동료평가 학술지에 게재된 문헌을 대상으로 “PEERS®”, “성인”, “성인기”, “PEERS for Young Adults”, “PEERS-YA”, “Program for the Education and Enrichment of Relational Skills” 등의 키워드를 사용하여 검색을 실시하였다. 주제와 관련 없는 검색 결과를 최소화하기 위해 “peer review”, “peer influence”, “peer support”는 제외어로 설정하였다. 검색 결과는 통합 후 중복 문헌을 제거하고, 제목 및 초록 검토를 통해 1차 선별 대상 문헌을 확보하였다. 문헌은 다음 조건을 모두 충족하는 경우 선정하였다. (1) PEERS® 관련 연구일 것 (2) 연구 대상자가 성인으로만 구성되어 있을 것 (3) National Technical Assistance Center on Transition(NTACT, 2018)에서 제시한 질적 지표 기준을 충족할 것. 또한 UCLA PEERS® 공식 기준에서는 권장 연령을 18-35세로 제시하고 있으나 본 연구는 프로그램의 실제 활용 양상과 확장성을 파악하는 데 초점을 두었으므로 연령과 장애 유무를 제한하지 않고 모든 성인 참여자를 포함하였다.
문헌 검색 결과 총 89편의 연구가 식별되었으며, 이 가운데 중복된 47편의 문헌을 제거한 후 42편이 1차 선별 대상으로 남았다. 총 42편의 문헌이 분석 대상 후보로 확정되었다. 1차 선별 단계에서는 제목과 초록을 검토하여 연구 주제와 부합하지 않는 5편과 대상자 조건을 충족하지 않는 21편을 제외하였고, 이에 따라 16편의 문헌이 2차 선별 대상으로 선정되었다. 다음으로 2차 선별 단계에서는 전문 검토를 실시하였으며, 이 과정에서 연구 대상이 성인으로만 구성되지 않은 문헌 3편과 부모를 대상으로 한 연구이기에 NTACT 질적 지표를 적용할 수 없는 연구 3편이 제외되었다. 이후 문헌 인용 검색을 통해 추가로 3편이 식별되어, 최종적으로 13편의 문헌이 본 연구의 문헌 분석에 포함되었다.
본 연구에서는 연구의 목적을 달성하고자 총 13편의 문헌을 두 가지 분석 틀을 활용하여 분석하였다. 첫째, 최종 선정된 문헌의 일반적 특징을 분석하기 위해 Zheng et al.(2021)이 청소년용 PEERS®를 대상으로 실시한 체계적 검토 및 메타분석의 분석 틀을 본 연구의 목적에 맞게 재구성하였다. 이를 바탕으로 저자, 연도, 참여자 정보(진단명·참여자 수·연령·언어/나라), 프로그램 정보(장소·세션 회기 및 빈도, 진행 시간·보호자 세션 유무·주제별 교육 및 프로그램 내용 수정 여부), 연구 설계, 유지 및 일반화 요소를 검토하였다. 또한 각 문헌에서 실제로 사용된 연구 도구와 그 도구가 측정한 하위 요소를 기준으로 연구 결과를 정리하였다. 이러한 기준은 선행연구(Zheng et al., 2021)의 분류체계를 연구 목적에 맞게 조정한 것으로, 주요 결과(사회적 지식, 사회적 반응 및 기술, 사회화의 질, 자폐적 특성)와 기타 결과(심리 및 정신 건강, 프로그램 수용성과 만족, 사회적 타당도)로 구분하여 제시하였다.
둘째, NTACT(2021)에서 제시한 질적 지표 점검표를 토대로 각 문헌의 연구 방법론의 질을 분석하였다. 집단연구의 질 평가는 참여자, 중재 및 비교조건, 결과 측정, 자료 분석의 네 가지 영역으로 구성되며, 총 19개의 세부 지표가 제시되어 있다. 선행연구(Kang & Yeo, 2023)에서 제시한 바와 같이 권장 사항이지만 질 평가를 위해 반드시 요구되는 것이 아닌 ‘중재 특성을 제공하는 음성 또는 비디오 발췌 자료를 포함’항목은 제외하였다. 또한 종속변인은 사전-사후 설문지가 대부분인 점을 고려하여 ‘결과 측정을 위한 평정자 간 신뢰도 보고’항목과 ‘자료 수집자 및 평정자의 연구 조건에 대한 눈가림 처리’항목을 제외하여 총 16개의 세부 지표를 기준으로 분석하였다. NTACT(2021)에 의거한 집단실험연구의 질적 지표 점검표는 <Table 1>에 제시하였다. 평가 기준에 충족하는 경우 ‘O’, 미충족하는 경우 ‘X’로 코딩하였다. 전체적 집단실험연구의 질 평가는 16개 지표를 모두 충족하면 ‘높은 질적 수준’, 별표시(*) 지표를 모두 충족하면 ‘비교적 높은 수준의 질’, 그 외의 경우에는 ‘질적 수준 미충족’으로 10개의 연구를 평가하였다.
단일대상연구의 질 평가는 참여자, 환경, 종속변인/측정, 독립변인/중재, 연구 절차, 연구 설계/그래프/결과, 사회적 타당도의 7가지 영역의 20개 세부 지표를 기준으로 분석하였다. NTACT(2021)에 의거한 단일대상연구의 질적 지표 점검표는 <Table 2>에 제시하였다. 평가 기준에 충족하는 경우 ‘O’, 미충족하는 경우 ‘X’, 해당하지 않는 경우‘N’으로 코딩하였다. 단일대상연구의 질 평가는 20개의 지표를 모두 충족하면 ‘높은 질적 수준’, 1~16번(*표시) 지표를 모두 충족하고 17~20번 중 최소 하나 이상의 지표를 충족하는 경우 ‘비교적 높은 질’, 그 외의 경우에는 ‘질적 수준 미충족’으로 평가하였다.
혼합연구의 질 평가는 목표/목적 정의, 표집 절차, 연구 설계, 자료 수집과 분석, 결과와 논의 5가지 영역의 28개 세부 지표를 기준으로 분석하였다. NTACT(2021)에 의거한 혼합연구의 질적 지표 점검표는 <Table 3>에 제시하였다. 평가 기준에 충족하는 경우 ‘O’, 미충족하는 경우 ‘X’, 해당하지 않는 경우‘N’으로 코딩하였다. 혼합연구의 경우 NTACT(2021)에서 질 판정 기준을 분명하게 제시하지 않은 점을 고려하여, NTACT(2021)를 활용하여 혼합연구를 주로 분석했던 선행연구에 근거하여 퍼센트로만 결과를 제시하였다(Kutscher et al., 2024).
본 연구에서는 분석자간 신뢰도를 확보하고자 일반적 특성과 NTACT(2021) 질적 지표 기준을 연구자와 특수교육 전공 석사 과정 한 명이 사전에 충분히 숙지하고 다른 장소에서 독립적으로 코딩하였다. 연구자가 모든 문서를 코딩하였으며, 특수교육 전공 석사과정 한 명의 평정자는 무작위로 선택된 5편(집단실험연구 3편, 단일대상연구 1편, 혼합연구 1편) 즉, 38%에 해당하는 문헌을 코딩하였다. 분석자 간 신뢰도는 ‘일치한 항목 수 ÷ 전체 항목 수 × 100’의 공식으로 산출하였으며, 일반적 특성 분석의 평균 신뢰도와 범위는 96%(94-100)로 질적 지표 분석의 평균 신뢰도와 범위는 93%(88-95)로 나타났다. 불일치한 항목은 두 분석자가 함께 모여 일반적 특성과 NTACT 질적 지표 기준을 재확인하고 합의 과정을 거쳐 재코딩하였다.
Ⅳ. 연구 결과
선정된 13편의 PEERS®-YA 중재 연구의 일반적 특성은 연구의 년도 순서대로 <Table 4>에 제시하였으며, 주요 결과와 기타 결과는 <Table 5>에 제시하였다.
| Author (Year) | Diagnosis, N, Age (Mean, Range) | Language / Country (Region) | Setting, # of Sessions, Frequency, Duration | Parent Session | Full Topic | Program Modification | Study Design | Maintenance / Generalization |
|---|---|---|---|---|---|---|---|---|
| Gantman et al. (2012) | ASD,N = 17, Age 20.4 (18-23) | English / USA | Clinic 14 sessions, Weekly, 90 min | Yes | Yes | No | Delayed-start RCT | No No |
| Laugeson et al. (2015) | ASD, N = 22, Age 20.4 (18-24) | English / USA | Clinic 16 sessions, Weekly, 90 min | Yes | Yes | No | Delayed-start RCT | Yes No |
| McVey et al. (2016) | ASD,N = 47, Age 20.2 (17-28) | English / USA | Clinic 16 sessions, Weekly, 90 min | Yes | Yes | No | RCT | No No |
| Chien et al. (2021) | ASD,N = 82, Age 26.5 (18-45) | Chinese / Taiwan | Clinic 16 sessions, Weekly, 90 min | Yes | Yes | Yes | RCT | Yes No |
| Moe et al. (2021) | Primary psychotic disorder, N = 19, Age 27.3 (18-35) | English / USA | Clinic 2-7 sessions(M = 3), Twice a week, 45 min | No | No | Yes | Single-group Pre-post Design | No No |
| Oh et al. (2021) | ASD,N = 31, Age 23.4 (18-35) | Korean / South Korea | Clinic 16 sessions, Weekly, 90 min | Yes | Yes | Yes | Delayed-start RCT | Yes No |
| Rose et al. (2021) | IDD,N = 10, Age 21.0 (18-26) | English / USA | University 23 sessions, Weekly, 60-90 min | No | No | Yes | Single-group Pretest-posttest Design | No No |
| Honan et al. (2022) | ASD < IDD,N = 7, Age (17-23) | English / Australia | Not specified 16 sessions, Weekly, 120 min | Yes | Yes | Yes | Mixed-method Design (Pre-post + FGI) | No No |
| Howorth et al. (2023a) | ASD,N = 3, Age 18 (17-19) | English / USA | University 8 sessions, Twice a week, 90 min | No | No | Yes | Single-case Design (MPD across behaviors) | Yes No |
| Howorth et al. (2023b) | ASD, N = 5, Age 19.4 (18-22) | English / USA | University 16 sessions, Weekly, 90 min | Yes | Yes | Yes | Single-case Design (MBL across behaviors) | Yes No |
| Platos et al. (2023) | ASD, N = 15, Age 23.3 (18-32) | Polish / Poland | Hybrid 16 sessions, Weekly, 90 min | Yes | Yes | Yes | RCT | Yes No |
| Harker et al. (2024) | ASD, N = 12, Age 43.2 (21-68) | English / USA | Virtual meetings 16 sessions, Weekly, 90 min | Yes | Yes | Yes | Delayed-start RCT | No No |
| Kim et al. (2025) | ASD, N = 5, Age 23.8 (19-30) | Korean / South Korea | Virtual meetings 16 sessions, Weekly, 90-120 min | Yes | Yes | Yes | Single-group Pretest-posttest Design | No No |
| Author (Year) | Main treatment outcomes | Other treatment outcomes |
|---|---|---|
| Gantman et al. (2012) | TYASSK: significant improvement; SRS: improvement in social communication and autistic mannerisms; SRSS: improvement in cooperation, self-control, and self-assertion; SSI: no significant change; QSQ: increased get-togethers | SELSA: decreased loneliness; EQ: increased empathy |
| Laugeson et al. (2015) | TYASSK: significant improvement; SRS: decreased autism symptoms; SSRS: improved overall social skills; QSQ: increased get-togethers | EQ: no change post-intervention; increased at 16-week follow-up |
| McVey et al. (2016) | TYASSK: significant improvement; SRS: significant improvement; SSIS-RS: decreased problem behaviors, no group difference in total social skills but improved within group;QSQ-YA: increased get-togethers | LSAS-SR: decreased social anxiety (in exploratory analysis, no significant group interaction); SPIN: no significant change; SELSA: no change;EQ: increased |
| Chien et al. (2021) | TYASSK: significant improvement; SRS: improved in self-report, social communication subscale incoach-report; ADOS: improved in all domains; AQ: improved socialness; CBOS: improved communication behaviors | SIAS: decreased; EQ, ESQ: increased empathy |
| Moe et al. (2021) | SSPA: improved social skills | BSI: no significant change; SESS: increased self-efficacy |
| Oh et al. (2021) | TYASSK: improved and maintained at 4-month follow-up; SRS-2: no group difference, improved in parent-report at follow-up; K-SSRS: no significant difference, self-report improved; QSQ: no significant change; ADOS-2: improved social interaction at 4-month follow-up | BAI: decreased at follow-up; BDI: decreased at follow-up; Social validity: reported (76.57%) |
| Rose et al. (2021) | TASSK: significant improvement; CSRS: not significant; FQS (instead of QSQ): not significant | - |
| Honan et al. (2022) | TYASSK: significant improvement; SRS: improved in parent-report, no change in self-report; QSQ: improved but not significant | SELSA: no change; Social validity: positive qualitative evaluation (participants, parents, coaches) |
| Howorth et al. (2023a) | SSPA: improvement in conversational skills (initiating, joining, exiting), no functional relation | - |
| Howorth et al. (2023b) | TYASSK: improved from 49% to 70%; SSPA: high effect in conversational skills (initiating, joining, exiting) |
- |
| Platos et al. (2023) | TYASSK: significant improvement; SRS: decreased social difficulties, maintained at 6-month follow-up; QSQ: increased in parent-report, not significant in self-report, not maintained at 6-month; ASRS: improved autistic traits | EQ: significant improvement (pre-post < pre-follow-up); Social validity: positive ratings, high recommendation, low to moderate burden |
| Harker et al. (2024) | - | Acceptability and satisfaction positive; program components rated helpful; higher satisfaction in second group |
| Kim et al. (2025) | TYASSK: no significant change; SRS-2: decreased self- and parent-report, especially in social communication and repetitive behaviors;QSQ:increased hosting and invitation experiences, decreased conflict scores (not significant) | - |
참여자는 비장애 성인은 없었으며 대부분 장애 성인 참여자가 주를 이루었다. 구체적으로 참여자의 진단명은 자폐스펙트럼장애 단독이 10편(76.9%)으로 가장 높은 비중을 차지하였다. 이 외에 지적장애, 지적 및 발달장애, 자폐스펙트럼장애와 지적 및 발달장애, 주요 정신 장애를 대상으로 한 연구가 각각 1편(7.7%)씩 포함되었다. 전체 참여자의 연령은 17세에서 68세까지 분포하였으며, 대부분 연구가 평균 연령 18세에서 27세 사이의 초기 성인을 대상으로 하였다. Harker et al.(2024)의 연구는 평균 연령이 43.2세(21~68세)로 중·장년층을 포함하는 특징을 보였다.
PEERS®-YA는 주로 클리닉(6편, 46.2%)에서 실시되었으며, 그 외 대학교(3편, 23,1%), 온라인(2편, 15.4%) 하이브리드(1편, 7.7%)로도 운영되었다. 또한 Honan et al.(2022)의 연구(1편, 7.7%)에서는 구체적 장소가 제시되지 않았다. 표준 운영 방식은 주 1회, 회기당 90분, 총 16회기로 7편(53.8%)의 연구가 이 기준을 따랐다. 총 회기 수는 평균 3회(2~7회)(Moe et al., 2021)에서 23회기(Rose et al., 2021)까지, 회기당 시간은 45분(Moe et al., 2021)에서 120분(Honan et al., 2022)까지 다양하였다. 또한 Moe et al.(2021)과 Howorth et al.(2023a)은 주 2회 방식으로 중재를 진행하였는데, 이는 입원 환자의 짧은 입원 기간(Moe et al., 2021)과 대학 학사 일정(Howorth et al., 2023a) 내에서 진행하기 위함이었다.
분석 대상 연구 13편 중 10편(76.9%)이 PEERS®-YA의 핵심 요소인 부모 세션을 포함하였다. 반면, 3편(23.1%)의 연구는 입원 병동 또는 대학 프로그램 내에서 진행되어 부모 훈련 없이 실시되었다(Howorth et al., 2023a; Moe et al., 2021; Rose et al., 2021). 부모 세션을 포함한 연구들(10편)에서는 성인기 참여자의 특성을 반영하여 다양한 방식으로 세션이 수정되거나 대체되었다. Honan et al.(2022)은 매주 90분 참여에 대한 부모의 부담을 반영하여 보호자 세션을 총 4회(2시간씩)로 축소하고, PEERS® 소셜 코치를 투입하여 지원을 보강하였다. 또한 일부 연구에서는 성인 자녀와 부모가 함께 데이트 등 민감한 주제를 다루는 것에 대한 불편감이 보고되었다(Honan et al., 2022). 이러한 이유로 부모 대신 대체 소셜 코치를 투입하는 방식이 활용되었다. Platos, Wojaczek & Laugeson (2023)은 부모의 물리적·시간적 부담 및 정서적 갈등을 고려하여 심리학 전공 대학생 인턴을 소셜 코치로 배정하였으며, 이는 특히 민감한 데이트 주제를 다룰 때 효과적으로 작용했다고 보고하였다. 앞서 부모 훈련 없이 진행된 연구로 분류된 Rose et al.(2021) 역시 부모 대신 또래 대학생을 소셜 코치로 활용하여 참여자의 기술 숙달과 과제 수행을 지원하였다.
PEERS®-YA 매뉴얼의 전체 프로그램을 모두 진행한 연구는 10편(76.9%)이었다. 나머지 3편(23.1%)은 매뉴얼의 일부 내용을 제외하거나 축소하여 운영하였다(Howorth et al., 2023a; Moe et al., 2021; Rose et al., 2021). 이러한 축소형 프로그램은 주로 시간적 제약, 대상자 특성, 또는 연구 환경의 특수성에 따라 구성되었다. 일부 연구에서는 정보교환, 대화 시작 및 유지, 언어적 놀림 대처, 그룹 대화에 참여하기, 빠져나오기 등 핵심적인 기초 상호작용 기술에만 초점을 맞추었다. 예를 들어, Moe et al.(2021)은 짧은 입원 기간 동안 효과를 극대화하기 위해 핵심 세션만 발췌하여 주 2회 집중형 중재를 실시하였다. Rose et al.(2021)은 인지적 부담이 적은 주제를 중심으로 구성하였으며 Howorth et al.(2023a)은 대학 일정과 참여자의 요구를 반영해 역할극 중심으로 회기를 압축하였다. 또한 일부 연구에서는 데이트 및 온라인 상호작용과 같이 민감하거나 복잡도가 높은 주제를 제외하거나 조정하는 경향이 확인되었다. Honan et al.(2022)은 데이트 주제가 일부 성인 참여자에게 개인적이고 불편한 주제로 인식되어 조정이 필요했음을 보고하였다. Howorth et al.(2023a)에서는 축약형 프로그램 설계 과정에서 해당 주제를 생략하고 기초적 대화 기술에 집중하였으며 이는 참여자의 수용도와 실행 가능성을 높이기 위한 결정이었다.
전체 13편의 연구 중 10편(76.9%)은 원본 프로그램을 일부 수정하여 적용하였으며, 파일럿 프로그램을 포함한 3편(23%)은 원본을 그대로 적용하였다(Gantman et al., 2012; Laugeson et al., 2015; McVey et al., 2016). 프로그램의 수정은 문화적 적합성, 대상자의 발달 및 인지적 특성, 전달 환경의 변화, 포괄성 증대 등 다양한 이유로 이루어졌다. 먼저 문화적 적합성을 높이기 위한 수정에서는 해당 나라에 따라 언어적 표현, 역할극 상황, 데이트 방식 등을 현지화하거나 유머와 대화 예시를 청년층이 익숙한 맥락으로 조정하였다(Chien et al., 2021; Oh et al., 2021; Platos et al., 2023). 이는 대상자가 프로그램 내용을 실생활과 연계해 이해하고 적용할 수 있도록 하는 데 목적이 있었다. Howorth et al.(2023a, 2023b)는 모두 미국 대학 환경에서 대상자 특성과 일정에 맞춰 프로그램을 조정하였다. 특히 Howorth et al.(2023a)에서는 단축형(8회기) 운영을 통해 기초적 상호작용 기술 습득에 집중하였으며, 다른 연구(Howorth et al., 2023b)에서는 표준형(16회기) 매뉴얼을 적용하되 대학 환경에 맞는 역할극 시나리오를 현지화하였다.
또한 인지적 부담을 줄이기 위한 수정도 보고되었다. Rose et al.(2021)은 지적 및 발달장애 대학생을 대상으로 언어적 자극을 단순화하고, 시각 자료와 실물 교보재를 강화하여 활동 이해도를 높였다. 더불어 Circles 커리큘럼을 통합해 대인 간 거리 개념 및 사회적 경계 학습을 보강하였다. Harker et al.(2024)은 기존 PEERS®가 전통적으로 ‘사회적 규범에의 적응’을 강조하는 틀을 넘어, 자폐 성인의 정체성과 자율성을 존중하는 방향으로 재구성하였다. 구체적으로 (1) 장애인 차별 감소를 위해 참여자 간 수직적 관계가 아닌 수평적 상호작용 구조를 강조하고, 자폐 특성으로 인한 차이를 결함으로 보지 않는 언어와 활동을 반영하였다. (2) 연령 적합성 증대를 위해 데이트, 직장 생활, 온라인 관계 형성 등 성인기 맥락에 맞는 사회적 상황 시나리오로 역할극 및 과제를 수정하였다. (3) 신경 다양성 존중을 위해 자폐 정체성에 대한 토론과 자기표현 시간을 별도 세션으로 마련하여, 참여자가 사회적 기술 습득의 주체로서 프로그램에 적극적으로 개입할 수 있도록 설계하였다.
전달 환경에 따른 수정 역시 활발히 이루어졌다. Honan et al.(2022)은 부모 세션 축소에 따라 소셜 코치를 추가 투입해 지원체계를 보완하였다. 특히 Kim et al.(2025)은 코로나19 상황에 대응하여 온라인 화상회의 및 메타버스 기반 플랫폼을 활용, 역할극 구조와 상호작용 피드백 방식을 비대면 환경에 맞게 정교하게 조정하였다. 구체적으로, 오프라인 역할극 활동을 가상공간(카페, 학교, 길거리 등)으로 전환하여 아바타 기반 실습을 실시하였고, 실시간 음성 및 시각 피드백을 병행하였다. 또한 그룹 피드백과 자기 성찰 시간을 체계적으로 설계하여 상호작용 기술의 실제 전이를 강화하였다.
가장 많이 활용된 연구 설계는 무작위통제시험 또는 지연 시작 무작위통제시험이었으며 총 7편(53.8%)이었다. 단일집단 사전-사후 설계는 3편(23.1%)(Kim et al., 2025; Moe et al., 2021; Rose et al., 2021), 단일대상연구는 2편(15.4%)(Howorth et al., 2023a; Howorth et al., 2023b), 사전-사후 설계와 초점집단면담이 결합된 혼합 방법 연구는 1편(7.7%)(Honan et al., 2022)으로 분석되었다.
중재 종료 후 효과의 유지 여부를 측정한 연구는 총 6편(46.2%)으로 확인되었다(Chien et al., 2021; Howorth et al., 2023a; 2023b; Laugeson et al., 2015; Oh et al., 2021; Platos et al., 2023). 일반화와 관련해서는 프로그램 과제 수행과 기술 연습 등을 통해 일반화를 시도한 연구는 있었으나, 일반화 효과를 정량적으로 측정한 연구는 없었다. 나머지 7편(53.8%)은 중재 직후의 효과만을 보고하였으며, 장기적 효과에 대한 정보는 제한적으로 제시되었다.
사회적 지식 검사(Test of Young Adult Social Skills Knowledge, 이하 TYASSK)은 총 9편의 연구에서 중재 후 유의미한 향상이 보고되었다(Chien et al., 2021; Gantman et al., 2012; Honan et al., 2022; Howorth et al., 2023b; Laugeson et al., 2015; McVey et al., 2016; Oh et al., 2021; Platos et al., 2023; Rose et al., 2021). 반면 Kim et al.(2025)에서는 통계적으로 유의미한 변화가 관찰되지 않았다.
사회적 반응 및 기술 측정 결과, 사회적 반응 척도(Social Responsiveness Scale, 이하 SRS)는 대부분의 연구에서 사회적 의사소통 및 자폐적 매너리즘 하위 영역의 유의미한 향상이 보고되었다(Chien et al., 2021; Gantman et al., 2012; Kim et al., 2025; Laugeson et al., 2015; McVey et al., 2016; Platos et al., 2023). 다만 보호자 보고에서는 유의미한 변화를 보였지만, 자기 보고에서는 유의미하지 않거나 변화가 나타나지 않은 연구도 있었다(Honan et al., 2022; Oh et al., 2021). SRS와 사회적 기술 평정 척도(Social Skills Rating System, 이하 SSRS)에서는 전반적인 사회적 기술의 향상이 보고되었으며(Gantman et al., 2012; Laugeson et al., 2015), 사회적 기술 향상 체계 - 평가 척도((Social Skills Improvement System - Rating Scales, 이하 SSIS-RS)의 경우, 문제행동이 유의미하게 감소했으나 사회기술 총점의 그룹 간 차이는 나타나지 않았다(McVey et al., 2016).
사회적 기술 수행평가(The Social Skills Performance Assessment, 이하 SSPA)를 사용한 연구에서는 대화 기술(시작하기, 참여하기, 빠져나오기) 측면의 향상이 보고되었으며(Howorth et al., 2023a; 2023b; Moe et al., 2021), Howorth et al.(2023a)에서는 기능적 관계가 입증되지 않았다. Rose et al.(2021)은 대화 기술 평정 척도(Conversational Skills Rating Scale, 이하 CSRS)에서 유의미하지 않은 변화를 보고하였으며, Gantman et al.(2012)의 SSI에서도 유의미한 차이가 나타나지 않았다. 또한 Chien et al.(2021)은 의사소통 행동 관찰 척도(Communication Behavior Observation Scale, 이하 CBOS)를 통해 의사소통 행동의 유의미한 향상을 보고하였다.
사회화의 질 질문지(Quality of Socialization Questionnaire, 이하 QSQ) 결과, 3편의 연구에서 함께 어울리기 빈도의 유의미한 증가가 보고되었다(Gantman et al., 2012; Laugeson et al., 2015; McVey et al., 2016). 반면 일부 연구(Honan et al., 2022; Kim et al., 2025; Oh et al., 2021)에서는 통계적으로 유의미한 차이가 나타나지 않았다. Platos et al.(2023)의 경우 부모 보고에서는 유의미한 향상이 있었으나 자가 보고에서는 유의하지 않았으며, 추적 시점에서 효과가 유지되지 않았다. Rose et al.(2021)이 사용한 우정의 질 척도(Friendship Qualities Scale, 이하 FQS) 역시 통계적으로 유의미하지 않았다.
참여자의 자폐적 특성 변화는 자폐증 진단 관찰 스케줄(Autism Diagnostic Observation Schedule, 이하 ADOS), 자폐 스펙트럼 지수(Autism-Spectrum Quotient, AQ), 자폐 스펙트럼 평가 척도(Autism Spectrum Rating Scales, ASRS)를 통해 측정되었다. ADOS를 결과 측정도구로 사용한 연구에서는 중재 이후 자폐 특성의 개선된 것으로 보고되었다. Chien et al.(2021)은 ADOS의 모든 영역에서 유의미한 향상을 보고하였으며, Oh et al.(2021)은 중재 4개월 후 추적 평가 시점에서 사회적 상호작용 영역의 향상을 확인하였다. AQ를 결과 측정도구로 활용한 Chien et al.(2021)의 연구에서는 ‘사회성’ 하위 영역에서 유의미한 개선이 보고되었다. ASRS를 사용한 Platos et al.(2023)의 연구에서도 중재 이후 참여자의 자폐 관련 특성이 유의하게 향상된 것으로 나타났다.
선정된 연구들은 사회적 지식과 기술 및 반응, 사회성의 질 외에도 연구 목적에 따라 참여자의 심리 및 정신 건강과 프로그램의 사회적 타당도 및 수용도를 측정하였다.
심리 및 정신 건강 영역에는 불안, 우울, 외로움, 공감, 자기효능감, 전반적 정신 건강 등이 포함되었다. 불안을 측정한 McVey et al.(2016)은 라이보비츠 사회불안 척도-자기보고형(Liebowitz Social Anxiety Scale - Self-Report, 이하 LSAS-SR) 점수의 유의미한 감소와 사회 공포증 척도(The Social Phobia Inventory, 이하 SPIN) 점수의 그룹 내 감소 경향을 보고하였다. Chien et al.(2021)은 사회적 상호작용 불안 척도(The Social Interaction Anxiety Scale, 이하 SIAS) 점수의 유의미한 감소를 Oh et al.(2021)은 벡 불안 척도(Beck Anxiety Inventory, 이하 BAI) 점수의 4개월 추적 시점 감소를 보고하였다. 우울의 변화를 알아본 Oh et al.(2021)의 연구에서는 4개월 추적 시점에서 벡 우울 척도(Beck Depression Inventory, 이하 BDI) 점수가 유의미하게 감소하였다고 보고하였다. 외로움을 측정한 연구는 두 편으로 확인되었으며, Gantman et al.(2012)은 성인용 사회적·정서적 외로움 척도(Social and Emotional Loneliness Scale for Adults, 이하 SELSA) 점수의 유의미한 감소를 보고하였으나, McVey et al.(2016)과 Honan et al.(2022)은 변화가 유의하지 않았다. 공감 능력에 대한 변화를 알아보기 위해 공감 지수(Empathy Quotient, 이하 EQ) 및 공감/체계화 성향 지수(Empathizing/Systemizing Quotient, 이하 ESQ)가 주로 활용되는 것으로 확인되었다. Gantman et al.(2012), McVey et al. (2016), Chien et al.(2021), Platos et al.(2023)에서는 공감 능력의 유의미한 향상이 보고되었다. 또한 Laugeson et al.(2015)와 Platos et al.(2023)은 추적 관찰 시점에서도 공감 능력의 향상이 유지되었다. Moe et al.(2021)는 자기효능감 및 정신 건강의 변화를 알아보기 위해서 조현병 자기효능감 척도(The Self-Efficacy Scale for Schizophrenia, SESS)와 간이 증상 척도(The Brief Symptom Inventory, BSI)를 활용했으며, 자기효능감은 점수의 유의미한 향상이 확인되었으나 정신 건강은 통계적으로 유의미한 변화가 관찰되지 않았다.
PEERS®-YA에 사회적 타당도 및 수용성을 측정한 연구도 있었다. Harker et al.(2024)은 전반적으로 긍정적인 수용성과 만족도를 보고하였으며, 피드백이 반영된 두 번째 그룹에서 더 높은 만족도가 나타났다. Platos et al.(2023)에서는 낮은 부담감과 높은 만족도가 보고되었으며, Honan et al.(2022)은 참여자, 부모, 코치 모두 긍정적인 평가를 제시하였다. Oh et al.(2021)에서는 사회적 타당도가 76.57%로 보고되었다.
본 연구에서는 NTACT(2021)에서 제시한 질적 지표 16개 항목을 기준으로 총 10편의 PEERS®-YA 집단실험연구를 평가하였다. 집단실험연구의 질적 지표 분석 결과는 년도 순서대로 <Table 6>에 제시하였으며 분석 결과는 다음과 같다.
| Author (Year) | Quality Indicator No. | (%) | Overall Quality | |||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Participants | Intervention and Comparison Conditions | Outcome Measures | Data Analysis | |||||||||||||||
| 1* | 2* | 3* | 4 | 5* | 6* | 7 | 8 | 9* | 10* | 11 | 12 | 13 | 14* | 15* | 16 | |||
| Gantman et al. (2012) | O | O | O | O | O | O | O | O | O | O | X | X | X | O | O | O | 81 | A |
| Laugeson et al. (2015) | O | O | O | O | O | O | O | O | O | O | X | O | X | O | O | O | 88 | A |
| McVey et al. (2016) | O | O | O | O | O | X | X | O | O | O | X | X | X | O | O | O | 69 | NQ |
| Chien et al. (2021) | O | O | O | O | X | X | X | O | O | O | X | O | X | O | O | O | 69 | NQ |
| Moe et al. (2021) | O | N | O | O | O | X | X | N | O | O | X | X | X | O | O | O | 56 | NQ |
| Oh et al. (2021) | O | O | O | O | O | O | O | O | O | O | O | O | X | O | O | O | 94 | A |
| Rose et al. (2021) | O | N | O | X | O | X | X | N | O | O | X | X | X | O | O | O | 50 | NQ |
| Platos et al. (2023) | O | O | O | O | O | O | O | O | O | O | X | O | X | O | O | O | 88 | A |
| Harker et al. (2024) | O | O | O | O | O | X | X | O | O | X | X | X | X | X | O | O | 56 | NQ |
| Kim et al. (2025) | O | N | O | O | O | X | X | N | O | O | X | X | X | O | O | O | 56 | NQ |
| (%) | 100 | 70 | 100 | 90 | 90 | 40 | 40 | 70 | 100 | 90 | 10 | 40 | 0 | 90 | 100 | 100 | 71 | NQ |
| 90 | 60 | 48 | 97 | |||||||||||||||
참여자 범주의 질적 지표 충족률은 평균 90%로 전반적으로 높은 수준을 보였다. 첫째, 장애 진단명, 인지능력 수준 등 참여자에 대한 장애나 어려움에 대한 정보는 10편(100%) 모든 문헌에서 충분히 제시되었다. 둘째, 집단 간 동질성을 확보하기 위한 절차와 관련해서 7편(70%)에서 무작위통제시험 또는 지연 시작 무작위통제시험을 통해 실험집단과 비교집단 간의 유사성을 보장하였다. 반면, 단일집단 사전-사후 설계를 사용한 3편의 연구(Honan et al., 2022; Moe et al., 2021; Rose et al., 2021)는 비교 집단이 존재하지 않아 해당 지표는 평가 대상에서 제외되었다. 셋째, 모든 연구(100%)에서 중재를 수행한 연구자 또는 중재자의 주요 특성이 구체적으로 기술되어 있었으며, 대부분 UCLA에서 제시한 PEERS®의 공식 자격을 보유하여 중재의 전문성과 신뢰성이 확보되었다. 넷째, 탈락 관련 정보는 9편(90%)의 연구에서 참여자 탈락이 30% 이하로 보고되어 NTACT 기준을 충족하였다. 그러나 Rose et al.(2021)은 서면 동의 절차만 언급하고 중도 탈락 여부나 탈락자 수에 관한 정보가 보고되지 않아 참여자 유지율을 판단할 수 없었다.
중재와 비교조건 범주의 질적 지표 충족률은 평균 60%로 다소 낮은 수준을 보였다. 첫째, 중재에 대한 구체적 설명 제시 항목의 경우 90% 충족률을 보였다. PEERS®-YA는 매뉴얼에 기반한 사회성 중재 프로그램(Laugeson, 2017)으로 대부분의 연구에서 중재에 대한 회기 및 주요 내용, 원본 프로그램의 일부 수정사항에 대한 구체적 정보가 보고되었다. 단, 1편의 연구(Chien et al., 2021)에서는 중국어판 PEERS®-YA 매뉴얼에 기반하여 중재를 적용하였으나 중재의 세부 구성이나 회기별 내용에 대한 기술이 본문에 제시되지 않았다. 둘째, 중재 충실도의 표면적 요소와 질적 요소의 충족률은 각각 40%로 낮은 비율을 보였다. 중재 충실도의 외적 요소는 중재 절차와 시간을 얼마나 정확히 준수했는지를 평가하는 항목이다. 중재 충실도 실행에 대한 언급하였으나(Gantman et al., 2012; Laugeson et al., 2015; Platos et al., 2023) 중재 충실도를 정량적으로 기술한 문헌은 한 편이었으며, 평균 중재 충실도는 0.95로 보고되었다(Oh et al., 2021). 반면, 중재 충실도의 질적 요소는 수행의 질, 상호작용의 완성도 등 중재가 얼마나 잘 수행되었는가를 평가하는 항목이다. 중재 충실도의 질적 요소를 충족한 4편의 문헌에서 연구 보조원이 중재 충실도를 모니터링하였다(Gantman et al., 2012; Laugeson et al., 2015; Oh et al., 2021). 또한 Platos et al.(2023)에서는 제 1저자가 모든 세션을 녹화하여 모니터링을 진행하였으며, 특히 Laugeson et al.(2015)은 100% 중재 충실도를 보장하기 위해 수업 중 누락된 부분을 세션 종료 전에 즉시 집단 지도자에게 보고하도록 하였다. 셋째, 비교조건에서 제공된 활동 내용 및 특성에 관한 설명 지표는 70% 충족률을 보였다. 단, 단일집단 사전-사후 설계를 사용한 3편의 연구는 비교집단이 존재하지 않아 평가에서 제외되었다(Honan et al., 2022; Moe et al., 2021; Rose et al., 2021).
결과 측정 범주의 질적 지표 충족률은 평균 48%로 낮은 수준을 보였다. 첫째, 다중 측정의 경우, PEERS®-YA는 사회성 중재와 밀접하게 연계된 사회적 지식, 사회적 수행과 관련한 평가도구를 활용하여 측정되었으며 중재와 밀접하게 연계된 다중 측정 수행 항목에서 10편(100%) 모두 충족하였다. 둘째, 중재 효과 측정을 위한 적절한 시점 항목의 경우, 중재 전후 모두 측정 또는 일정 기간 후 유지 측정이 된 경우에 ‘충족’으로 평가하여 9편(90%)이 충족되었다. Harker et al.(2024)에서는 집단 간의 사후 결과만을 측정하여 제외되었다. 셋째, 결과 측정에 대한 신뢰도 증거 제공 항목의 경우, 선행연구 또는 자체 연구의 신뢰도 계수를 모두 작성한 경우, ‘충족’으로 평가한 결과 10% 충족률을 나타냈다. QSQ 또는 TYASSK를 제외하고 대부분의 연구 도구에서는 선행연구의 신뢰도 계수를 명시하였다(Gantman et al., 2012; Kim et al., 2025; Laugeson et al., 2015; McVey et al., 2016; Platos et al., 2023). Oh et al.(2021)에서는 자체 연구의 모든 도구에 대한 신뢰도 계수를 제시함으로써 ‘충족’으로 평가될 수 있었다. TYASSK의 경우, 초기연구(Gantman et al., 2012; Laugeson et al., 2015)에서는 신뢰도에 대한 언급은 없었으나 점차적으로 자체 연구의 신뢰도를 제시하는 노력이 나타났다. 예를 들어 Mcvey et al.(2016)에서는 TYASSK의 0.22의 낮은 내적 일치도를 나타냈으며, Platos et al.(2023)에서는 사전 검사에서는 0.19, 사후 검사에서는 0.72 수준을 보고하였다. 넷째, 사후 검사 이후 최소 1회 이상의 유지 기간을 측정한 지표는 40%의 충족률을 나타났다. 다섯째, 측정의 준거와 구인 타당도 제공을 모두 제시한 연구는 부재하였으며(0%), 일부 연구에서 부분적으로 타당도를 보고하였다. 예를 들어, Mcvey et al.(2016)에서 SSIS-RS(Gresham & Elliott, 2008)의 높은 타당도(0.77), SRS(Constantino et al. 2003)의 우수한 타당도, LSAS-SR(Fresco et al., 2001)의 동일 구성 개념 측정 도구들과의 높은 수렴 타당도(0.49-0.73), SPIN(Connor et al., 2000)의 보통 수준의 수렴 타당도(0.57)을 언급하였다. Chien et al.(2021)은 AQ의 중국어판 심리측정학적 특성은 타당화되었으며(Lau et al., 2013), 중국어판 EQ는 높은 수준의 타당도, 중국어판 ESQ의 높은 수준의 타당도(Auyeung et al., 2009), 중국어판 SIAS의 우수한 타당도(Yang, 2003) 등을 언급하였다.
결과 분석 범주의 질적 지표 충족률은 평균 97%로 나타났다. 첫째, 통계기법과 분석단위가 연구 문제 및 가설과 논리적으로 일치하는지와 관련한 항목에서 90%로 나타났다. 선정된 연구들은 대부분 PEERS®-YA의 효과성을 탐색하기 위한 것으로 연구 문제(집단 간 차이 검증)와 분석기법(t-test, ANOVA 등)의 선택은 대부분 연구 목적과 부합하였다. Harker et al.(2024)의 연구에서는 평균과 표준편차만을 제시하고 통계적 유의미성 검증을 실시하지 않아 ‘미충족’으로 평가되었다. 둘째, 효과 크기 계산 영역에서는 모든 연구에서 평균과 표준편차를 제시함으로써 100%로 높은 충족률을 나타냈다. 셋째, 모든 연구에서 연구 결과는 명료하고 논리적이고 일관된 방식으로 작성되어 100% 높은 충족률을 나타냈다.
집단실험연구 전체(10편)의 질적 지표 충족률은 평균 71%를 나타냈다. 연구 각각의 전반적인 질을 살펴보면 높은 수준의 질 0%, 비교적 높은 수준의 질 40%, 질적 수준 미충족이 60%로 나타났다. 주목할 점은 집단실험연구 2편 (Chien et al., 2021; McVey et al., 2016)은 ‘비교적 높은 수준의 질’에 거의 근접하였으나 공통적으로 중재 충실도 평가 지표 영역에서 미충족으로 나타났다.
본 연구에서는 NTACT(2021)에서 제시한 질적 지표 20항목을 기준으로 총 2편의 PEERS®-YA 단일대상연구를 평가하였다. 단일대상연구의 질적 지표 분석 결과는 <Table 7>에 제시하였다. 분석 결과는 다음과 같다.
| Author (Year) | Quality Indicator | (%) | Overall Quality | |||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Participants, Setting | Dependent Variable/ Measure | Independent Variable/ Intervention | procedures | Design/Graph/Results | Social Validity | |||||||||||||||||
| 1* | 2* | 3* | 4* | 5* | 6* | 7* | 8* | 9* | 10* | 11* | 12* | 13* | 14* | 15* | 16* | 17 | 18 | 19 | 20 | |||
| Howorth et al. (2023a) | O | O | O | O | O | O | O | O | O | X | O | X | O | O | X | O | X | X | O | O | 80 | NQ |
| Howorth et al. (2023b) | O | O | O | O | O | O | O | O | O | X | O | O | O | O | O | O | X | X | O | O | 85 | NQ |
| (%) | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 100 | 0 | 100 | 50 | 100 | 100 | 50 | 100 | 0 | 0 | 100 | 100 | 83 | NQ |
| 100 | 100 | 100 | 67 | 75 | 83 | 50 | ||||||||||||||||
참여자의 질적 지표 충족률은 평균 100%로 나타났다. 첫째, 다른 연구자도 유사한 특성의 대상을 선정할 수 있도록 참여자에 대한 상세한 정보 제공해야 영역에서 모든 연구(100%)에서 연령, 장애 유형, 성별 등 구체적으로 제공되었다. 둘째, 참여자 선정과정은 다른 연구자가 절차를 재현할 수 있도록 자세하게 기술해야 하는 영역에서도 평균 100%로 나타났다. 마지막으로 환경의 질적 지표 충족률은 100%였으며, 연구가 수행된 물리적 환경의 핵심적인 특성은 연구 복제가 가능할 만큼 정밀하게 기술되었다.
종속변인/ 측정 충족률은 평균 100%로 나타났다. 첫째, 연구에서 측정되는 대상이 무엇인지 조작적으로 기술되었으며, 각 종속변인은 타당하고 일관된 평가가 가능하도록 명확히 설명되었다. 구체적으로 두 연구 모두 대화 시작하기 7단계, 대화 들어가기 10단계, 대화 나가기 4단계로 구체적으로 제시하였다. 둘째, 종속변인의 수량화 가능한 지표를 산출할 수 있는 절차를 통해 측정영역을 살펴보면, 모든 연구가 촉진 정도에 따른 행동 정확도를 수량화해 백분율로 제시하였다. 셋째, 종속변인 측정 과정의 정밀한 기술 영역을 살펴보면, 모든 연구에서 각 종속변인에 대한 평가 절차가 명확히 기술되었으며 연구자가 동일한 방식으로 측정 과정을 재현할 수 있도록 하였다. 넷째, 종속변인은 시간의 경과에 따라 반복적으로 측정영역을 살펴보면 다음과 같다. 두 연구 모두 기초선, 중재, 유지 기간을 통해 중재 이전의 패턴을 관찰하고, 조건 또는 단계 간 수행을 비교할 수 있도록 종속변인을 반복 측정하였다. 다섯째, 각 종속변인에 대해 신뢰도 또는 관찰자 간 일치도 수집과 최소한의 기준 영역(예: IOA ≥ 80%, Kappa ≥ 60%)은 다음과 같다. 모든 문헌에서 종속변인을 측정하기 위하여 관찰자 간 일치도를 측정하였고 95%로 보고되었다(Howorth et al., 2023a; 2023b).
독립변인/ 중재 충족률은 평균 67%로 나타났다. 첫째, 독립변인은 결과의 타당한 해석과 절차의 정확한 복제가 가능하도록 조작적으로 정밀하게 정의되어야 하는 항목에서는 100%를 나타냈다. PEERS®-YA에서 사용된 자료나 구체적 행위에 대한 명확한 설명을 포함하였다. 둘째, 독립변인이 연구자가 통제하는 조건에서 체계적으로 조작되어야 하는 항목에서는 0%였다. 셋째, 독립변인의 중재 충실도는 관찰 가능한 방식으로 측정되어야 하는 항목에서는 100%를 나타냈다. 즉, 독립변인의 실행이 계획된 절차에 따라 얼마나 정확히 이루어졌는지를 보여주는 절차 충실도 자료가 제시되어야 하며, 이는 독립변인의 실행을 지속적·직접적으로 측정하거나 다른 형태의 보고 자료로 제공될 수 있다(NTACT, 2021). 모든 연구의 중재 충실도는 100%를 나타냈으며, 제2의 관찰자가 매뉴얼을 체크하며 누락된 부분이 있는 경우 “XX쪽 부분을 잊지 마세요.”라고 알려주었다고 언급하였다.
연구 절차 충족률은 평균 75%로 나타났다. 첫째, 기초선 단계에서는 종속변인의 일관된 반응 패턴이 나타날 때까지 반복 관찰되어야 하며 일반적으로 5회 이상 측정이 권장되지만 안정된 패턴이 확인된다면 그보다 적은 측정이 허용되는 영역의 경우 50%로 나타났다. 집단 평균 데이터에서 기초선 측정을 3회, 7회, 11회(Howorth et al., 2023b), 3회, 4회, 7회(Howorth et al., 2023a)로 나타났으나, Howorth et al.(2023a)에서는 기초선의 변동의 폭(예: 0~40%)이 크고 안정된 패턴이 확인되지 않은 시점에서 중재가 적용되어 ‘미충족’으로 평가되었다. 둘째, 모든 문헌(100%)에서 기초선 조건의 절차적 특성은 재현이 가능할 정도로 정밀하게 기술되었다.
연구 설계/ 그래프/ 연구 결과 충족률은 평균 83%로 나타났다. 첫째, 실험 효과의 반복적 입증 항목에서는 최소 세 명 이상의 참여자 간 및 세 개의 행동 간에서 효과가 입증되어 100%로 코딩되었다. 둘째, 연구 설계는 내적 타당도를 위협하는 요소를 통제영역의 경우, 두 문헌 모두 기본적으로 행동간 기초선 설계를 기초로 진행되어 ‘독립변인의 단계적 도입’을 기준으로 코딩하였다. 그 결과 50% 충족률을 나타냈다. Howorth et al.(2023b)의 경우, 독립변인의 단계적 도입을 3단계에 걸쳐 진행되었다. 반면 Howorth et al.(2023a)의 연구에서는 세 명의 참가자 중에서 두 명의 자료에 대해서 독립변인을 단계적으로 도입하였으나 유지 단계에 대한 기록이 없었으며, 그룹 평균에 대한 자료에서는 2단계까지만 기초선, 중재, 유지 구간을 제시하였다. 셋째, 외적 타당도 확립의 경우 100% 충족하였다. 구체적으로 참여자가 5명(Howorth et al., 2023b), 3명(Howorth et al., 2023a)에 대한 반복을 제시하였다.
사회적 타당도 충족률은 평균 50%로 나타났다. 첫째, 종속변인은 사회적으로 중요한 대화 기술로 연구의 필요성 파트에 분명하게 제시하고 있었으나, 개인에게 해당 종속변인이 실제로 중요한 의미를 갖는지 ‘평가’하는 과정이 없었기 때문에 ‘미충족’으로 코딩되어 모두 0%로 나타났다. 둘째, 중재로 인한 종속변인의 변화 크기 또한 사회적 타당도 ‘평가’를 근거로 그 변화를 분석 및 보고해야 하는 영역에서도 ‘미충족’으로 코딩되어 0%로 나타났다. 셋째, 독립변인의 실용성과 비용 효율성 영역에서는 실행 소요 시간, 투입 인력 수, 환경 조정의 정도, 준비물 등을 제시하여 ‘충족’으로 평가하였으며 100%의 충족률을 나타냈다. 넷째, 일상적인 물리적·사회적 맥락의 경우, 대학생 또는 대학 생활에 대한 준비와 적응을 돕기 위해 설계된 여름 대학 전환 프로그램에 참여한 자폐스펙트럼장애 청년을 대상으로 대학 강의실에서 진행된 점 등을 고려하여 일상적 환경을 과도하게 방해하지 않는 맥락에서 수행된 점을 고려하여 ‘충족’으로 평가하여 100%의 충족률을 나타냈다.
단일대상연구의 전체(2편)의 질적 지표 충족률은 평균 83%를 나타냈다. 연구 각각의 전반적인 질을 살펴보면 높은 수준의 질 0%, 비교적 높은 수준의 질 0%, 질적 기준 미충족이 100%로 나타났다. 주목할 점은 단일대상연구 1편(Howorth et al., 2023b)은 ‘비교적 높은 수준의 질’에 거의 근접하여 16개 필수 지표 중 15개 지표(94%)와 사회적 타당도 지표를 충족하였다. 부족했던 미충족 지표는 독립변인의 체계적 조작으로 조작의 기준 부재였다.
본 연구에서는 NTACT(2021)에서 제시한 지표 28개 항목을 기준으로 총 1편의 PEERS®-YA 혼합연구를 평가하였으며 평균 90%의 충족률을 나타냈다. 혼합연구의 질적 지표 분석 결과는 <Table 8>에 제시하였다. 분석 결과는 다음과 같다.
| Author (Year) | Quality Indicator | (%) | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Defining Goal/ purpose | Sampling Procedures | Research Design | |||||||||||||
| 1* | 2* | 3* | 4 | 5* | 6* | 7* | 8* | 9* | 10* | 11 | 12 | 13* | 14* | ||
| Honan et al. (2022) | O | O | O | O | O | O | O | O | O | O | X | X | O | O | 90 |
| 100 | 60 | 100 | |||||||||||||
| Data Collection and Analysis | Results & Discussion | ||||||||||||||
| 15* | 16 | 17* | 18* | 19* | 20* | 21* | 22* | 23* | 24* | 25* | 26* | 27* | 28* | ||
| O | O | X | O | O | O | O | O | O | O | O | O | O | O | ||
| 90 | 100 | ||||||||||||||
목표/ 목적 정의 충족률은 100%를 나타냈다. 혼합연구의 목적, 수행 방법, 수행 이유를 명확하게 제시하였으며, 서론에서 PEERS®-YA에 대한 이론적, 개념적, 실천적 틀을 분명하게 보고하였다(Honan et al., 2022). 또한 양적 및 질적 측면에서의 선행연구 분석을 토대로 혼합연구 설계 선택 이유에 대해서 명시적으로 제시하였다. 연구 목적과 연구 단계의 일치성의 경우, Honan et al.(2022)은 효과성과 수용성이라는 연구 목적을 명확히 구분하여 양적 및 질적 단계를 체계적으로 수행하는 모습을 나타냈다. 마지막으로 연구 질문이 연구 대상자를 명확하게 식별하는 항목에서도 ‘충족’으로 코딩되었다.
표집 절차 충족률은 60%를 나타냈다. 대상자의 포함 및 제외 기준을 제시하였으며, 질적·양적에 대한 표본 크기를 제시하였다. 또한 표집 절차를 상세히 기술하였다. 단, 양적 및 질적 단계에서 표본 크기 등을 고려해야하는 항목에서는 ‘미충족’이었다. 구체적으로 양적 단계에서는 분석 연구에서 표본 크기가 작음을 인식하고 정규성 검정 및 비모수 검정(Wilcoxon Signed Rank Test)을 병행하여 통계적 타당성을 보완하고자 하는 노력은 있었으나 검정력 분석은 아니었다. 또한 질적 단계에서는 FGI를 ‘프로그램 내용의 수용 가능성’, ‘프로그램 참여의 실행 가능성’, ‘참여 전반에 대한 경험’, ‘결과가 향후 생활 변화에 기여 할 수 있는 방식에 대한 의견’을 명확히 제시하였으나 포화도에 대한 언급은 없었다. 표집 설계, 방식, 표본 크기와 연구 목적 진술 간의 일반화의 명확한 연계 영역에서도 ‘미충족’을 나타냈다. 분석 문헌에서 작은 표본 수의 한계로 통계적 일반화가 어려웠고, 연구 결과를 이론적 수준에서 연결·확장하는 분석적 일반화에서도 명시적인 근거가 부족하였다.
연구 설계 충족률은 100%로 나타났다. 양적 연구 설계의 경우, 사전-사후 비교에 기초한 단일집단 준-실험 설계로, 프로그램 효과를 탐색하려는 연구 목적과 일치하였다. 정규성 검증과 비모수검정을 병행해 소표본 한계를 보완하였으며, 양적 분석 절차가 명확히 기술되었다. 질적 연구 설계의 경우, 포커스 그룹을 통한 귀납적 내용분석을 명시하고, 참여자의 경험 탐색이라는 연구 목적과 설계가 일치하였다.
자료 수집과 분석 충족률은 90%로 나타났다. 양적 도구의 사용 지침과 시행 절차에 관한 정보 제시 영역의 경우, 문항 수, 평가 영역, 채점 방법과 의미 등을 구체적으로 제시하였다. 중재 효과 측정을 위한 적절한 시점 항목의 경우, 집단연구설계 기준과 동일하게 적용하였으며, 중재 전-후 모두 측정되어 ‘충족’으로 평가하였다. 측정 도구 개발 과정의 명확성의 경우, SRS-2, SELSA, TYASSK, QSQ 모든 도구에서 신뢰도와 타당도가 제시되지 않아 ‘미충족’으로 평가되었다. 질적 도구와 그 시행 절차에 관한 정보 영역은 ‘충족’으로 코딩되었다. 분석 문헌에서는 FGI 개발자, 핵심 질문 영역, FGI 시행 시점, 참여자 그룹 구분, 진행자 역할, 녹음 및 전사 절차 등 구체적인 정보를 제시하는 노력을 보였다. 혼합연구 데이터 분석 전략 영역의 경우, 분석 연구에서는 ‘내재적 순차 설계(embedded sequential design)’임을 명시하고 양적· 질적 데이터를 통합하여 결과를 상호보완적으로 제시하였다. 또한 기술통계를 포함한 양적 분석의 전제조건이 충족의 명시성 영역에서도 ‘충족’을 보였다. 구체적으로 정규성은 Shapiro-Wilk 검정, 히스토그램 및 박스플롯 시각검사, 이상치 확인으로 평가하였다. 또한 관련 있는 기술통계와 추론통계 영역에서는 분석 문헌에서는 대응표본 t-검정이 수행되었으나, 표본 크기가 작았기 때문에 비모수적 윌콕슨 부호순위검정(Wilcoxon Signed Rank Test)도 추가로 실시되었다는 점을 토대로 ‘충족’으로 평가되었다. 마지막으로 질적 분석에 사용된 코딩 기법의 명확성과 구체적 기술 영역, 혼합의 수준의 명확성 제시, 접근 방식의 비중인지 제시하는 영역에서는 ‘충족’으로 나타났다.
Ⅴ. 논의
본 연구의 목적은 성인을 대상으로 실시된 PEERS®-YA 중재 연구의 일반적 특성을 살펴보고, 각 연구의 연구 방법론의 엄격성을 평가하는 것이다. 연구 목적을 달성하기 위해 PRISMA 지침에 따라 체계적 문헌 분석을 실시하여 성인 대상 PEERS®-YA 연구의 일반적 특성을 분석하였으며, NTACT에서 제시한 질적 지표를 적용하여 각 연구의 전반적인 질을 평가하였다. 모든 연구를 종합했을 때 ‘높은 수준의 질’을 충족하는 연구는 없었으며, 집단실험연구의 경우 4편(40%)만이 ‘비교적 높은 수준의 질’에 해당하였다. 이러한 선행연구 분석 결과를 토대로 향후 PEERS®-YA의 연구 방법의 질 향상 제고를 위한 방향성에 대해 논의하면 다음과 같다.
첫째, PEERS®-YA 매뉴얼 개발 취지에 따라 자폐스펙트럼장애 초기 성인을 중심으로 수행되었으나, 일부 연구에서는 사회성에 어려움을 보이는 지적 및 발달장애 성인과 주요 정신 장애 진단을 받은 성인도 포함하고 있었다. 더불어 Harker et al.(2024) 연구에서 확인되듯 PEERS®-YA가 초기 성인기에 국한되지 않고 중·장년층까지 적용된 점은 생애주기 전반을 아우르는 중재 확장의 가능성을 시사한다. 이는 성인의 사회적 참여를 지원하는 중재 모델이 진단명이나 연령 범주에 의존하기보다는 개인의 사회적 역량, 환경적 요구, 생애 단계에 기초하여 설계되어야 함을 의미한다. 이러한 점에서 PEERS®-YA의 유연한 적용과 다양한 인구집단으로의 확장은 사회기술 중재의 접근성과 포괄성을 높일 뿐 아니라 실제 생활에서의 실천적 유효성을 강화하는 기반이 될 수 있다. 또한, PEERS®-YA는 초기에는 임상 환경 중심으로 운영되었으나(Gantman et al., 2012; Laugeson et al., 2015), 최근에는 대학(Howorth et al., 2023a; Rose et al., 2021), 온라인(Harker et al., 2024; Kim et al., 2025), 하이브리드(Platos et al., 2023) 등 다양한 환경으로 확장되었다. 이러한 변화는 성인의 사회적 활동 공간이 오프라인을 넘어 온라인·가상공간으로 확대되고 있음을 반영하며, 사회기술 중재 역시 실제 생활세계에서 자연스럽게 연습·검증되는 환경 기반 접근이 요구됨을 보여준다.
둘째, 성인 참여자를 대상으로 한 최근 연구들은 부모 세션을 유연하게 수정하거나 부모 대신 다양한 소셜 코치 를 투입하여, 자기결정과 자율성을 존중하는 방향으로 프로그램 구조를 재편하였다(Moe et al., 2021; Howorth et al., 2023a; Rose et al., 2021). Platos et al.(2023)은 심리학 전공 대학생 인턴을 Rose et al.(2021)은 또래 대학생을 코치로 투입함으로써 부모의 직접적 감독이 아닌 또래 관계 속에서 사회적 연습이 이루어지도록 하였다. 이러한 변화는 성인 참여자를 치료의 객체가 아니라 사회참여의 주체로 인식하고, 그들의 발달 단계와 문화적 맥락에 맞게 프로그램을 운영한 결과로 해석할 수 있다. 또한 일부 연구에서는 정보교환, 대화 시작과 유지, 그룹 대화 참여, 언어적 놀림 대처 등 핵심 기술만을 선별하거나, ‘데이트’ 세션과 같은 주제를 생략하여 참여자의 수용도와 현실적 타당성을 높이고자 하는 노력도 나타났다. 이러한 참여자 맞춤형 수정은 성인의 생애 주기적 생태학적 맥락과 신경 다양성 가치에 부합하는 실천이라 할 수 있다. 더불어 Hull et al.(2017)은 자폐스펙트럼장애 성인이 타인의 기대에 맞추기 위해 사회적 위장을 지속할 경우 정체성 손상과 피로를 경험한다고 보고하였으며, Leadbitter et al.(2021)은 자폐스펙트럼장애 개인의 자율성과 정체성을 존중하는 접근이 사회참여를 촉진한다고 강조하였다. Milton(2012)과 Han et al.(2023)은 자폐인의 사회적 어려움이 개인의 결함이 아니라 상호 오해와 사회적 배제에서 비롯된다고 설명하였다. 이러한 근거는 PEERS®-YA가 단순히 사회적 규범을 학습시키는 훈련이 아니라, 다양한 인지·소통 양식을 인정하고 상호이해를 촉진하는 참여자 중심 모델로 발전해야 함을 시사한다.
셋째, 대부분의 연구가 중재 효과의 유지를 보고하려는 모습도 나타났으나 일반화에 대한 정량적 검증은 이루어지지 않았다. 일부 연구에서는 참여자의 생활 맥락 안에서 기술을 연습하는 등(Rose et al., 2021) 일반화를 시도한 경우도 있었으나 이를 객관적으로 수치화하거나 통계적으로 분석하지 않아 중재 효과의 외적 타당성을 확보하는 데 한계가 있었다. 일반화는 특정 중재 환경뿐만 아니라 실제 생활 장면으로 전이되는지를 평가하는 핵심 지표이므로, 이에 대한 정량적 검증이 필요하다. 특히 청소년 대상 PEERS® 연구에서는 참여자의 통합학급 등 실제 환경에서 일반화를 정량적으로 측정하려는 시도(Kim & Na, 2025)도 이루어졌으며, 이는 사회성 기술이 훈련 상황을 넘어 생활 맥락 속으로 확장될 수 있음을 보여준다. 성인은 청소년보다 대학, 직장, 지역사회 등 다양한 사회적 환경에 노출되므로, 중재로 습득한 기술이 이러한 환경에서 실제로 사용되고 유지되는지를 정량적 지표로 평가하려는 노력이 필요하다. 향후 연구에서는 단기적 기술 습득뿐 아니라, 다양한 사회적 맥락에서의 전이를 평가할 수 있는 일반화 평가 체계를 포함함으로써 중재 효과의 전이를 확인할 필요가 있다.
넷째, 집단실험연구의 질적 지표 충족률은 평균 71%로 다수 연구가 필수 기준을 충족했음에도 중재 충실도 보고가 누락된 점이 공통된 한계로 나타났다(Chien et al., 2021; McVey et al., 2016). 이는 충실도 자체의 문제가 아니라, 평가·산출 절차를 명확히 기술하지 않아 NTACT(2021)의 기준에서 제외된 것으로, 발달장애 성인 대상 사회성 기술 연구에서도 충실도 보고율이 14.8%에 불과하다는 선행 연구의 결과와도 일치한다(Jeong, Lee, & Kwak, 2023). 따라서 향후 연구에서는 충실도 시행 여부만 언급하는 수준을 넘어 정량적 수치와 관찰 지표를 포함한 표준화된 보고 체계가 요구된다. 또한 결과 측정에서는 TYASSK와 QSQ의 신뢰도·타당도 근거가 충분히 기술되지 않아 결과 해석의 개념적 타당성을 약화시키는 문제가 확인되었다. 그러나 PEERS®-YA 매뉴얼(Laugeson, 2017)은 성인용 TYASSK는 청소년용 TASSK(Laugeson & Frankel, 2010)의 수정판이며 성인용에서도 동일하게 알파 계수 .56으로 보고되었다. 저자들은 측정 문항이 광범위한 사회기술 영역을 포괄한다는 점을 고려하여, 이 수준의 알파 계수를 ‘중간 정도의 신뢰도로서 수용 가능하다’고 제시하고 있다. 또한 QSQ는 QPQ(Frankel & Mintz, 2011)를 수정하여 개발된 도구로, 갈등 척도의 알파 계수 .87, SSRS 문제행동 척도와의 수렴 타당도(r= .35, p < .05), 그리고 임상·지역사회 표본 간 변별력(p < .05)을 근거로 신뢰도와 타당도가 확보되어 있다. 그럼에도 불구하고 일부 연구에서는 이러한 근거를 명시적으로 인용하지 않거나 측정의 신뢰도를 재확인하지 않아, 결과 해석의 개념적 타당성을 약화시키는 한계가 나타났다. 최근에는 TYASSK의 내적 신뢰도 계수를 직접 산출하거나, 사전·사후 신뢰도를 보고하는 등 측정의 신뢰성을 강화하려는 노력이 나타나고 있다((McVey et al., 2016; Platos et al., 2023). 이러한 변화는 PEERS®-YA 연구가 단순한 효과 검증을 넘어 측정의 타당성과 신뢰도 확보를 중재 연구의 필수 요소로 인식하기 시작했음을 시사한다. 향후 연구에서는 사용된 측정 도구의 심리측정학적 근거를 명확히 제시함으로써 결과 해석의 타당성과 임상적 의미를 강화할 필요가 있다.
다섯째, 단일대상연구의 전체 질적 지표 충족률을 83%로 나타났으나, 독립변인의 조작 시점과 절차가 명확히 보고되지 않은 점이 가장 큰 한계로 나타났다. 단일대상연구는 중재와 결과 간 인과관계를 검증하기 위해 중재의 도입·종료 시점과 단계 전환 기준을 명확히 기술해야 한다는 전제를 갖지만(NTACT, 2021), 분석된 연구들에서는 기초선-중재-유지 단계 전환 시점이 명시되지 않아 해당 지표 충족률이 0%였다. 이는 실험적 통제가 확보되지 않았음을 의미하며, 단일대상연구에서 독립변인의 조작 절차가 인과적 해석의 핵심 요건임을 강조한 선행 연구의 주장과도 일치한다(Horner et al., 2005). 따라서 향후 연구에서는 중재의 도입 시점과 절차, 전환 기준을 사전에 정의하여 명확히 보고할 필요가 있다. 또한 기초선 반복 측정과 독립변인의 단계적 도입 지표는 50% 충족률을 보여, 최소한의 통제 절차는 일부 확보되었으나 내적 타당도 수준은 여전히 제한적임을 확인할 수 있었다. 기초선은 집단실험연구의 통제집단과 유사한 기능을 하므로 안정적이거나 예측 가능한 패턴이 확보될 때까지 반복 측정이 필요하며(Alqraini, 2017; Kazdin, 2011), 중재 도입 전 수행 수준을 비교·예측하는 기준으로 기능한다(Kazdin, 2011). 그러나 일부 연구에서는 첫 번째 중재 단계가 충분히 안정화되기 전에 다음 단계를 도입하는 사례가 관찰되었으며(Howorth et al., 2023a), 이는 단계적 통제 원리를 약화시킬 가능성이 있다. 단일대상연구에서는 참여자·행동·환경 간 중재 도입 시점을 달리하여 외생적 요인—시간 경과, 자연 성숙, 환경 변화—을 배제하고 독립변인의 효과를 논리적으로 입증해야 한다(Horner et al., 2005; Kazdin, 2011). 따라서 향후 PEERS®-YA 단일대상연구에서는 기초선 안정성과 단계적 도입 절차의 엄격성을 강화하여 인과적 해석의 타당성을 높여야 한다.
여섯째, 혼합연구의 경우 NTACT(2021)가 제시한 전반적 질 평가 기준이 집단실험연구나 단일대상연구처럼 명확하게 구분되어 있지 않아 ‘높은 수준의 질’ 혹은 ‘비교적 높은 수준의 질’과 같이 등급화하여 판단하기는 어렵지만, 본 연구에서 산출된 평균 질적 지표는 90%로 비교적 높은 수준을 보였다. 그러나 이러한 수치는 혼합연구의 질을 온전히 설명하지 못하며, 양적 요소의 질, 질적 요소의 질, 그리고 두 자료를 통합하는 과정의 질이 상호의존적으로 작용한다는 점을 함께 고려해야 한다. Hong et al.(2018)이 강조한 것처럼 혼합연구는 세 영역 중 어느 하나라도 취약할 경우 전체 연구의 타당성과 해석 가능성이 제한될 수 있으며, 특히 통합 과정이 부적절할 경우 양적·질적 자료가 제공하는 강점이 충분히 발휘되지 못한다. 이러한 관점에서 혼합연구의 높은 평균값은 연구자들이 양적·질적 자료를 비교적 엄격하게 수집·분석했음을 시사하나, 통합의 질이 구체적으로 어떻게 구현되었는지에 따라 전반적 연구 질은 달라질 수 있다. 따라서 향후 연구에서는 양·질 각각의 엄격성을 충족하는 것을 넘어, 두 자료 간의 연결 방식, 통합 분석 전략, 통합을 통해 도출된 해석의 명확성을 체계적으로 보고하여 혼합연구 고유의 장점이 실질적으로 발현되도록 하는 노력이 필요할 것이다.
종합하면, 성인 대상 PEERS®-YA 연구들은 다양한 환경과 참여자를 기반으로 지속적으로 확장되고 있으며 사회성·자폐 특성·정신건강 영역에서 일관된 긍정적 효과를 보고하고 있으나, 근거기반실제로서 확고히 자리매김하기 위해서는 중재 충실도의 체계적 보고, 측정도구의 신뢰도·타당도 명시, 기초선 안정성과 단계적 도입 등 실험적 통제의 강화, 일반화 평가의 정량화와 같은 연구방법론적 엄격성을 보다 일관되고 표준화된 방식으로 충족하는 노력이 요구된다.
본 연구의 제한점은 다음과 같다. 첫째, 연구 방법론적 측면에서 NTACT(2021)는 근거기반실제 판정을 위해 높은 수준의 과학적 엄격성을 요구하며, 각 지표를 ‘충족’ 또는 ‘미충족’으로 이분화하여 코딩하도록 제시하고 있다. 이에 따라 일부 항목이 실제로는 ‘부분적으로 충족’인 경우에는 ‘미충족’으로 분류되어 연구의 질이 과소평가 되었을 가능성이 있다. 둘째, 본 연구는 질적 지표를 중심으로 각 연구의 방법론적 질을 분석하였으나 중재의 효과 크기에 대한 정량적 검증은 이루어지지 않았다. PEERS®-YA 관련 선행연구들의 수가 아직 충분하지 않아서 메타 분석을 수행하기에는 한계가 있었다. 따라서 본 연구는 중재의 질적 타당성에 초점을 두었으며, 향후 연구에서는 공통의 측정지표를 기반으로 한 데이터 축적을 통해 PEERS®-YA의 효과 크기를 정량적으로 검증하는 연구가 필요하다. 셋째, 본 연구는 성인을 연령 기준으로 포함하여 분석하고자 하였으나, 현재까지 축적된 PEERS®-YA 연구가 대부분 자폐스펙트럼장애, 지적 및 발달장애 성인을 대상으로 이루어져 있어 연구 결과가 장애 성인 중심으로 편중되는 한계를 가진다. 따라서 본 연구가 제시하는 경향성과 방법론적 논의는 성인 전체보다는 장애 성인을 중심으로 해석될 필요가 있으며, 향후 비장애 성인을 포함한 다양한 성인 집단에서의 연구 축적이 요구된다. 마지막으로 본 연구는 성인을 대상으로 한 PEERS®-YA 연구를 NTACT(2021)의 질적 지표를 기준으로 분석함으로써, 해당 프로그램의 과학적 근거와 연구 설계의 엄격성을 체계적으로 검토했다는 점에서 의의가 있다. 이러한 분석 결과는 향후 연구들이 과학적이고 체계적인 연구 설계와 실행의 질을 강화하는 데 기초 자료로 활용될 수 있을 것이다.





