ABOUT

소개

안녕하세요. Han-co 블로그를 운영하는 Han입니다. 일본에 살면서 신용·금융 쪽 데이터 사이언티스트로 일하고 있습니다.

처음부터 데이터 관련 직종에 근무한 것은 아닙니다. 제 첫 커리어는 자동차 제조업 회사의 생산 기술 연구 엔지니어로 시작했습니다. 가공 라인의 공정 순서나 정밀도 같은 것을 다뤘는데, 어느 날 "이걸 데이터로 분석하면 다르게 보이지 않을까" 싶었습니다. 그래서 독학으로 분석과 머신러닝을 시작했고, 라인 관리를 자동화하고 시각화하는 프로젝트를 직접 제안해 공장 도입까지 프로젝트를 맡았습니다. 거기서부터 데이터에 관심을 가지게 되었습니다.

그 경험을 살려서 금융권의 데이터 사이언티스트로 이직했습니다. 데이터 사이언티스트로 일하면서 다룬 것은 카드론 같은 금융 상품의 여신(신용) 스코어 모델, 심사 룰 개선, 후불 결제의 연체 분석, 카드 마케팅 타겟팅, 그리고 금융범죄를 막기 위한 이미지 대조 같은 것들이었습니다. 사내에서 다른 분들께 AI를 가르치는 일도 했습니다.

현재는 일본의 한 핀테크 그룹에서 여신 모델을 만들고 있습니다. 매일 신용 심사 데이터나 구매 데이터, 어플리케이션 이용 이력 등을 들여다보는 게 본업입니다.

요즘 머릿속에 있는 것

  • 어떻게 리스크가 큰 고객을 더 정확히 분류해낼 수 있을까
  • 한도액을 늘리거나 줄이면 리스크는 어떻게 변화할까
  • AI를 활용한 피쳐 생성, 모델 구축
  • AI를 활용한 어플리케이션 개발(취미)

이 블로그에 대해

이 블로그는 제가 금융계 데이터 사이언티스트로 이직하고 느꼈던 것들에서 시작했습니다. ML 책들을 보며 독학했는데 신용 심사에서는 뭔가 핀트가 맞지 않았습니다. 알고 보니 이 분야는 일반적인 데이터 사이언스와는 규칙이 좀 다른 곳이었습니다. 그 차이를 실무 언어로 정리해보려고 합니다. "가르친다"기보다, 실무에서 배운 것을 공유하고 싶습니다. 저보다 더 오래 이 분야에서 일해 오신 선배님들에게 조언도 받고 싶습니다.

주로 Python과 SQL로 일합니다(6년 넘게). scikit-learn, pandas 같은 도구부터 Databricks, DataRobot 같은 플랫폼까지 씁니다.

몇 가지 약속

이 블로그의 모든 글은 공개된 지식과 일반론만 다룹니다. 특정 회사의 데이터나 내부 방법은 쓰지 않고, 글에 회사 이름도 일부러 적지 않습니다. 글은 제 개인 견해이며 소속 회사의 입장이나 전문 자문이 아닙니다. 자세한 건 면책 고지.

새 글을 메일로 받기

연재가 올라오면 메일로 알려드립니다. 스팸은 없고, 언제든 해지할 수 있습니다.

스팸 없음, 언제든 해지