어떤 기사를 찾으시나요?
닫기
2025-12-22 22:26:12 기준
  • 규제
  • AI
  • 약국 약사
  • #수가
  • 인수
  • 허가
  • #제품
  • #의약품
  • 의약품
  • gc

'통계적 유의성 입증'…샤페론 임상 결과 엇갈린 이유

  • 김진구
  • 2023-07-19 06:19:00
  • 샤페론 "코로나19 치료제 누세핀 2b상서 통계적 유의성 확보" 주장
  • 프로토콜 준수 환자만 별도 분석한 결과…"고위험군 한쪽으로 쏠려"
  • 전체 환자 대상으로는 통계적 유의성 확보 못해…"글로벌 3상 준비"

[데일리팜=김진구 기자] 코로나19 치료제를 개발 중인 샤페론이 임상2b상 결과를 발표했다.

다만 관련 공시에선 2b상 결과 "통계적 유의성을 확보하지 못했다"고 밝힌 반면, 보도자료를 통해서는 "통계적으로 유의미한 평가변수 차이를 얻어 효과를 입증했다"고 설명했다.

결과가 엇갈린 이유는 분석대상 환자 선정 방식에 있다. 공시에선 전체 환자를 대상으로 한 결과를, 보도자료에선 프로토콜을 준수한 환자를 별도로 분석한 결과를 각각 소개했다.

보도자료에선 "효과 입증"…공시에선 "통계적 유의성 확인 못해"

샤페론은 18일 COVID-19 폐렴 환자를 대상으로 '누세핀'의 글로벌 2b/3상 임상시험을 진행한 결과, 통계적으로 유의한 차이를 확인하지 못했다(p-value=0.1138)고 공시했다.

다만 기타 투자 판단과 관련한 중요사항을 통해 시험군1과 시험군2, 대조군간 통계적으로 유의한 차이를 확인했다고 부연 설명했다.

기자들에게 배포한 보도자료에서도 샤페론은 "누세핀의 다국가 임상2b상에서 효과를 입증했다"며 "2b상에서 확인한 유의한 용량을 설정해 글로벌 3상 시험을 진행할 계획"이라고 밝혔다.

샤페론은 지난해 1월 글로벌 임상2b/3상을 승인받았다. 임상은 한국과 불가리아·보스니아·북마케도니아·세르비아에서 코로나19 폐렴 환자 174명을 대상으로 진행됐다.

환자는 세 그룹으로 나뉘었다. 시험군1은 몸무게 1kg당 약물을 0.2mg 투여했고, 시험군2는 0.4mg를 투여했다. 대조군에게는 위약이 투여됐다.

1차 평가변수는 세계보건기구(WHO)가 마련한 코로나19 증상 평가기준(8-point ordinal scale)이 2점 감소하는 데 걸리는 시간을 측정하는 것이었다.

전체 환자 대상 분석 vs 프로토콜 준수 환자만 분석

공시와 보도자료의 평가 결과가 엇갈린 이유는 분석대상 환자를 선정하는 방식이 달랐기 때문이다.

우선 공시에선 전체 환자(full analysis set)를 대상으로 한 분석결과를 소개했다. 시험군1은 코로나 증상 평가기준이 2점 감소할 때까지 평균 8.56일, 시험군2는 평균 7.53일이 걸렸다. 대조군의 경우 평균 9.18일이 걸려 통계적으로 유의한 차이를 확인하지 못했다. p밸류 값은 0.1138이었다.

공시 하단의 부연설명과 보도자료에선 프로토콜 준수 환자(per protocol set)를 대상으로 분석했다. 이 방식대로 분석한 결과 시험군1은 평균 8.59일, 시험군2는 평균 7.33일이 걸렸다. 대조군은 평균 9.15일로 나타났다. 세 그룹을 비교한 결과 통계적으로 유의한 차이가 확인됐다. 대조군 대비 시험군1의 p밸류 값은 0.5269, 시험군1 대비 시험군2는 0.4846이었다.

샤페론은 특히 시험군2에서 대조군 대비 임상적으로 유의한 변화를 확인했고, 두 그룹을 비교하면 통계적으로도 유의한 차이를 확인했다고 설명했다.

샤페론 “고위험군 환자 쏠림+제외됐어야 할 환자 뺀 결과”

별도의 환자 구성으로 결과를 분석한 이유에 대해 샤페론 측은 "고위험군이 한쪽으로 쏠렸고, 임상시험에 포함되지 않아야 할 환자가 일부 포함됐기 때문"이라고 설명했다.

샤페론 관계자는 "임상시험 대상자 174명 중 23명을 제외했다"며 "나이가 많거나 BMI 지수가 높은 고위험군이 시험군1과 시험군2에 다수 쏠렸다"고 말했다. 임상결과의 분석에서 이들의 영향을 일부 보정했다는 설명이다.

이 관계자는 이어 "애초에 임상시험에 포함되지 않았어야 할 환자도 일부 포함돼 이들도 임상결과 분석에서 제외했다"며 "임상 대상자 모집 시 신장기능 저하 환자와 간기능 저하 환자를 제외했어야 하는데, 동유럽 국가에선 신장·간기능 평가 척도가 우리나라와 달라 신장기능과 간기능이 좋지 않은 환자 일부가 임상시험에 포함됐다"고 말했다.

ICH 가이드라인, PP 분석 결과 ‘신중한 해석’ 권고

프로토콜 준수 환자를 대상으로 한 분석결과(per protocol, PP)에 대해 ICH 가이드라인에선 신중한 해석이 필요하다고 설명하고 있다.

ICH 가이드라인은 "프로토콜 세트를 사용하면 분석에서 새로운 치료가 더 유효하다는 것을 검정해낼 가능성이 높아진다(The use of the per protocol set may maximize the opportunity for a new treatment to show additional efficacy in the analysis)"면서도 "그러나 가설 검정 및 치료효과의 추정은 임상시험에 따라 보수적일 수도 그렇지 않을 수도 있다(However, the corresponding test of the hypothesis and estimate of the treatment effect may or may not be conservative, depending on the trial)"고 명시하고 있다.

특히 "심각한 편향이 발생할 수 있으며, 이는 연구 프로토콜 준수가 치료방법이나 최종결과에 따라 영향을 받을 수 있기 때문(The bias, which may be severe, arise from the fact that adherence to the study protocol may be related to treatment and outcome)"이라고 서술했다.

ICH 가이드라인 중 PP 관련 내용 발췌.
이런 이유로 가이드라인은 프로토콜 준수 환자를 대상으로 임상 결과를 분석할 땐 "피험자를 제외하는 정확한 이유를 완전히 정의 및 문서화해야 한다(The precise reasons for excluding subjects from the per protocol set should be fully defined and documented before breaking the blind in a manner appropriate to the circumstances of the specific trial)고 분명히 하고 있다.

마찬가지 이유로 식품의약품안전처와 한국거래소 역시 프로토콜 준수 환자(PP)를 대상으로 한 결과보다는 전체 환자(FAS)를 대상으로 한 분석결과를 제출하도록 하고 있다.

업계 전문가들도 같은 의견이다. 통상적으로 전체 환자를 대상으로 한 분석을 원칙으로 하며, PP 분석은 추가로 진행한다고 입을 모은다.

한 제약업계 RA 관계자는 "임상시험에서 결과값은 ITT(Intention-To-Treat) 프로토콜에 따라 기존에 배정된 대로 해석한다. 다만 임상 약물을 반대로 전달했다든지 하는 경우라면 결과를 다시 볼 수는 있다"며 "다만 이 때도 반드시 ITT 분석과 견줘서 해석해야 한다"고 말했다.

또 다른 관계자는 "임상시험 결과를 해석할 때 전체 환자 대상(FAS)과 프로토콜 준수 환자(PP)를 동시에 보긴 한다"며 "다만 우월성을 입증하는 임상은 FAS가 1차 평가변수로 둔다. 동등성을 평가하는 임상의 경우 일부 PP를 먼저 보는 경우가 있다"고 설명했다.

댓글을 작성하려면 로그인 해주세요.
  • 댓글 0
  • 최신순
  • 찬성순
  • 반대순
운영규칙
  • 등록된 댓글이 없습니다.
    첫 댓글을 남겨주세요.