인터넷전문은행과 P2P금융업체들이 등장하면서 신용평가 방식에도 다양한 기법이 적용되고 있습니다. 심리테스트를 이용하거나 소셜네트워크서비스(SNS) 상에서의 활동을 활용하는 등 각 업체마다 방식들이 다릅니다.
이는 과거 데이터를 통해 미래의 리스크를 예측하는 통계적 방법론 덕분에 가능합니다. 과거의 어떤 데이터를 이용해서 어떠한 알고리즘을 통해 예측을 할지는 각 업체들의 알고리즘에 달린 것이죠.
가장 널리 알려진 방법은 로지스틱 회귀분석(Logistic Regression)입니다. SNS 활용 방식이나 카드 사용 빈도 등 여러 독립변수를 통해 종속변수(대출을 잘 상환하는 좋은 고객인지, 그렇지 않은 나쁜 고객인지)를 예측하는 것입니다. 보다 쉽게 사례를 통해 설명해보겠습니다.
|
가령 1년동안 온라인 쇼핑을 10~20번 한 사람들 모두 대출을 연체하지 않고 성실하게 갚아나갔다는 결과가 나왔다고 가정해보겠습니다. 그러면 A사는 1년간 온라인쇼핑을 10~20번 한 사람들은 대출 상환 의지와 능력이 충분하다고 보고 향후에도 이와 같은 조건의 대출 신청자들에게는 좋은 조건에 대출을 제공할 것입니다.
또 과거 데이터를 통해 1년간 온라인쇼핑을 5~10번 한 사람들 중 대출을 연체한 비율이 20%라고 결과가 나왔다면, 향후 대출 신청자 중 1년간 온라인쇼핑을 5~10번 한 사람은 10~20번한 사람보다 리스크가 약간 높기 때문에 더 높은 금리를 받는 것입니다.
위의 사례는 ‘1년간 온라인쇼핑 횟수’라는 독립변수를 하나만 사용했기 때문에 간단해보일 수가 있지만 실제로는 훨씬더 많은 변수들을 사용하게 됩니다.
|
이러한 방식을 기본으로 해서 핀테크업체들은 점차 신용평가 알고리즘을 고도화하고 있습니다. P2P금융업체인 펀디드는 개인회생이나 연체 등 특이한 조건(이상치)이 있을 경우 일반적으로 사용되던 로지스틱 회귀분석을 통한 예측이 맞지 않을 경우가 많다는 점을 착안했습니다. 이상치가 있는 변수에 대해서는 종속변수에 미치는 영향을 최소화해서 알고리즘을 돌릴 경우 보다 정확한 예측이 가능해집니다.
펀디드는 이를 통해 지난달 스페인에서 개최된 모바일월드콩그레스(MWC)에서 4YFN에 참가해 자사의 신용평가모델을 소개하기도 했습니다.
대출 금융기관 입장에서는 신용평가 모델이 중요합니다. 신용평가 모델에 따라 실제로는 좋은 고객인데 나쁜 고객이라고 판단하게 되면 고객을 잃게 되는 것이고, 나쁜 고객인데 좋은 고객이라고 판단하게 되면 대출금을 다시 받지 못하게 되기 때문이죠. 은행이나 카드사 등이 빅데이터 분석에 투자하고, 핀테크업체들이 알고리즘을 계속 고도화하는 이유입니다.