이번 연구는 동일한 민감도(100%)를 가진 두 가지 대장내시경 인공지능 시스템(아이넥스코퍼레이션)에서, 위양성 비율이 높은 시스템 A(3.2%)와 낮은 시스템 B(0.6%)를 비교하였다. 그 결과 위양성 비율이 낮은 시스템 B가 선종 발견률과 대장내시경 당 선종 수에서 유의미하게 높은 성과를 보였다고 밝혔다. 위양성 비율이 낮은 시스템 B는 선종 발견률에서 50.4%를 보이며 표준 대장내시경(44.3%)과 위양성 비율이 높은 시스템 A(43.4%) 보다 높은 달성률을 보였다. 또한, 비종양성 용종 절제 비율을 21.3%로 억제하며, 위양성 비율 관리가 임상 성능과 효율성 향상에 중요하다는 점을 입증했다.
대장암은 전 세계적으로 세 번째로 흔한 암이며, 암 관련 사망 원인 중 두 번째를 차지한다. 선종을 포함한 전암성 용종의 발견 및 절제는 대장암 위험을 줄이는 데 핵심적이며, 대장내시경은 이를 위한 표준 절차로 자리 잡고 있다. 하지만 대장내시경은 시술자의 실력에 따라서 검사의 수행성적이 차이가 있는 것이 한계점으로 지적되고 있다. 연구팀은 인공지능 보조 대장내시경 시스템이 시술자에 따른 내시경 검사의 기술적‧인지적 한계를 극복하기 위한 가능성을 지니고 있다고 강조했다.
세부 분석에 따르면“위양성 비율이 높은 시스템 A는 대장내시경 숙련자들에서 표준 대장내시경에 비해 선종 발견률을 저하시키는 동시에 불필요한 용종 절제를 늘여서 오히려 환자의 안전과 의료의 비용효과성에 나쁜 영향을 줄 수 있다”며, “인공지능 도입 시 실제 의료환경에서 다양한 의료진과의 상호작용이 철저히 검증되어야 한다”고 덧붙였다.
|