국세청은 2025년에 착수하는 법인 세무조사의 50%를 AI로 선정할 예정이다. 그간 축적된 세무조사 실적을 정형화하고 이를 AI에게 학습시켜 탈세 위험 예측 모델을 만들었다고 한다. 당장은 법인만을 대상으로 한다지만 곧 개인에게로, 그리고 사업소득 이외 다른 소득으로 확대하지 말라는 법은 없다.
AI도 결국은 데이터로부터 시작한다. 거기에서 패턴을 발견하려는 것이다. 데이터 분석은 기본적인 회귀분석에서부터 시작한다. 회귀모형 ‘y=α+βx+ε’에서 ‘β’라는 계수의 부호와 크기를 통해 x와 y의 관계를 설명하게 된다.
주목할 부분은 ‘ε’(엡실론)이다. ‘오차항’(error term) 혹은 ‘교란항’(disturbance term)이라고 한다. 우리의 관심사인 x 이외에 y에 영향을 주는 모든 요소가 들어 있다. 오차항은 그 안에 ‘우리가 발견할 수 있는(발견하려는)’ 패턴이 존재해서는 안 되는 부분이다. 오차항은 작을수록 좋겠지만 아예 존재하지 않을 수는 없다. 오차항을 배제한다는 것은 데이터 자체를 거부하는 것이나 마찬가지이기 때문이다. 알 수 없는(dark) 영역으로 남아 있을 뿐이다.
위 회귀모형에서 y가 범주형(예를 들어 탈세면 1, 탈세가 아니면 0으로 처리)인 경우를 ‘로짓분석’이라고 부른다. 어떤 사건의 발생 확률에 관한 분석이다. 그리고 이런 모형들은 AI에서의 머신러닝과 그중 딥러닝(인공신경망)에까지도 확장돼 쓰인다. 그래서 딥러닝을 복잡한 회귀분석일 뿐이라고 말하기도 한다. AI도 어디까지나 (빅)데이터에서 시작하기 때문이다. 다만 딥러닝은 AI가 스스로 패턴을 찾고, 사람이 무엇과 무엇의 관계를 미리 지정해 줄 필요가 없다는 면에서 혁신적이다.
세무조사로 확보된 자료를 분석하는 데 AI를 활용하는 것과, AI로 세무조사 대상자를 선정하는 것은 차원이 다른 문제다. 제한된 인력을 가진 과세관청은 후자에서 AI의 역할이 더 필요할 것이다. 하지만 대상자를 마음대로 선정할 수는 없다. 법에 정해진 사유에 따라야 한다.
예를 들면 “정기적으로 성실도를 분석한 결과 불성실 혐의가 있다고 인정되는 경우”(정기 선정) 등이나 “신고 내용에 탈루나 오류의 혐의를 인정할 명백한 자료가 있는 경우”(부정기 선정) 등에 해당해야 한다. 또한 적법하게 세무조사가 개시됐다는 점은 과세관청이 증명해야 한다는 게 법원의 입장이다. 세무조사 절차상 하자를 다투는 케이스에서는 거의 언제나 선정 사유 존재 여부가 쟁점이다.
그런데 세무조사 대상자를 AI로 선정했다면, 해당 세무조사는 그 자체로 적법할까. AI를 활용해 사람은 인식할 수 없었던 패턴까지 찾아내 선정했더라도 여전히 메커니즘을 설명할 수 없는(dark) 부분으로 남아 있는, ‘오차항’과 같은 존재는 무시해도 되는 것인가. 현재로서는 쉽게 단언하기 어렵다. 당신을 세무조사 대상자로 선정한 것은 AI라는 설명은, 정작 당사자에게는 어리둥절한 이야기일 뿐이다. 이 부분에 대한 선제적인 고민은 과세관청의 몫이다.
최성훈 법무법인 은율 변호사
AI도 결국은 데이터로부터 시작한다. 거기에서 패턴을 발견하려는 것이다. 데이터 분석은 기본적인 회귀분석에서부터 시작한다. 회귀모형 ‘y=α+βx+ε’에서 ‘β’라는 계수의 부호와 크기를 통해 x와 y의 관계를 설명하게 된다.
주목할 부분은 ‘ε’(엡실론)이다. ‘오차항’(error term) 혹은 ‘교란항’(disturbance term)이라고 한다. 우리의 관심사인 x 이외에 y에 영향을 주는 모든 요소가 들어 있다. 오차항은 그 안에 ‘우리가 발견할 수 있는(발견하려는)’ 패턴이 존재해서는 안 되는 부분이다. 오차항은 작을수록 좋겠지만 아예 존재하지 않을 수는 없다. 오차항을 배제한다는 것은 데이터 자체를 거부하는 것이나 마찬가지이기 때문이다. 알 수 없는(dark) 영역으로 남아 있을 뿐이다.
위 회귀모형에서 y가 범주형(예를 들어 탈세면 1, 탈세가 아니면 0으로 처리)인 경우를 ‘로짓분석’이라고 부른다. 어떤 사건의 발생 확률에 관한 분석이다. 그리고 이런 모형들은 AI에서의 머신러닝과 그중 딥러닝(인공신경망)에까지도 확장돼 쓰인다. 그래서 딥러닝을 복잡한 회귀분석일 뿐이라고 말하기도 한다. AI도 어디까지나 (빅)데이터에서 시작하기 때문이다. 다만 딥러닝은 AI가 스스로 패턴을 찾고, 사람이 무엇과 무엇의 관계를 미리 지정해 줄 필요가 없다는 면에서 혁신적이다.
세무조사로 확보된 자료를 분석하는 데 AI를 활용하는 것과, AI로 세무조사 대상자를 선정하는 것은 차원이 다른 문제다. 제한된 인력을 가진 과세관청은 후자에서 AI의 역할이 더 필요할 것이다. 하지만 대상자를 마음대로 선정할 수는 없다. 법에 정해진 사유에 따라야 한다.
예를 들면 “정기적으로 성실도를 분석한 결과 불성실 혐의가 있다고 인정되는 경우”(정기 선정) 등이나 “신고 내용에 탈루나 오류의 혐의를 인정할 명백한 자료가 있는 경우”(부정기 선정) 등에 해당해야 한다. 또한 적법하게 세무조사가 개시됐다는 점은 과세관청이 증명해야 한다는 게 법원의 입장이다. 세무조사 절차상 하자를 다투는 케이스에서는 거의 언제나 선정 사유 존재 여부가 쟁점이다.
그런데 세무조사 대상자를 AI로 선정했다면, 해당 세무조사는 그 자체로 적법할까. AI를 활용해 사람은 인식할 수 없었던 패턴까지 찾아내 선정했더라도 여전히 메커니즘을 설명할 수 없는(dark) 부분으로 남아 있는, ‘오차항’과 같은 존재는 무시해도 되는 것인가. 현재로서는 쉽게 단언하기 어렵다. 당신을 세무조사 대상자로 선정한 것은 AI라는 설명은, 정작 당사자에게는 어리둥절한 이야기일 뿐이다. 이 부분에 대한 선제적인 고민은 과세관청의 몫이다.
최성훈 법무법인 은율 변호사
최성훈 법무법인 은율 변호사
2024-11-29 34면
Copyright ⓒ 서울신문. All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지