AI 사용 꿀팁

[실전 AI 업무 자동화] #02. "VLOOKUP의 종말" - ChatGPT로 엑셀 데이터 전처리 1분 만에 끝내는 실무 파이프라인 구축

들어가며: 당신의 야근을 만드는 주범, '데이터 노가다'

수많은 직장인이 오늘도 엑셀 창을 띄워놓고 결측치(빈칸)를 찾고, 날짜 형식을 통일하고, VLOOKUP 수식이 꼬여서 에러(#N/A)와 씨름하며 야근을 합니다. 기획이나 분석 같은 '진짜 일'을 하기도 전에, 데이터를 보기 좋게 다듬는 '전처리(Preprocessing)' 과정에서 에너지를 모두 소진해 버리는 것입니다.

하지만 ChatGPT의 'Advanced Data Analysis(데이터 분석)' 기능이 도입되면서, 엑셀 매크로나 파이썬(Python) 코딩을 몰라도 누구나 데이터를 1분 만에 정제할 수 있는 시대가 열렸습니다. 오늘 칼럼에서는 당신을 엑셀 지옥에서 구원해 줄 'AI 데이터 전처리 완벽 가이드'를 공개합니다.

1. 엑셀 대신 파이썬을 돌려주는 '보이지 않는 조수'

ChatGPT Plus(유료 버전)에 엑셀(.xlsx)이나 CSV 파일을 드래그해서 올려놓으면, AI는 백그라운드에서 스스로 파이썬(Python) 코드를 작성하고 실행합니다. 즉, 당신이 "이 열의 평균을 구해줘"라고 말하면, AI가 내부적으로 pandas 라이브러리를 호출해 데이터를 분석하고 결과만 깔끔하게 보여주는 방식입니다.

이 기능의 가장 큰 장점은 '인간의 모호한 언어를 찰떡같이 알아듣는다'는 것입니다. 엑셀에서는 날짜 형식을 바꾸기 위해 복잡한 TEXT 함수를 써야 하지만, ChatGPT에게는 그저 "날짜 형태를 전부 'YYYY-MM-DD'로 통일해"라고 말만 하면 끝납니다.

2. 실전 적용: '데이터 청소부' 프롬프트 3단계

지저분한 로우 데이터(Raw Data)를 받았을 때, 엑셀을 켜지 말고 ChatGPT에 파일을 올린 뒤 아래의 3단계 프롬프트를 순서대로 입력해 보십시오.

[1단계: 결측치 및 이상치 스캔]

"업로드한 데이터셋을 훑어보고, 값이 비어있는 행(결측치)이나 다른 데이터와 단위가 현저하게 다른 이상치(Outlier)가 있는지 찾아내서 리스트로 정리해 줘. 그리고 결측치를 어떻게 채우면 좋을지 통계적으로 가장 합리적인 방법 2가지를 제안해 줘."

[2단계: 데이터 형식 통일 및 클렌징]

"네가 제안한 방법 중 1번(평균값 대체)을 사용해서 빈칸을 채워줘. 추가로 다음 작업을 수행해:

  • '금액' 열에 있는 쉼표(,)와 '원' 글자를 모두 제거하고 순수 숫자로 변환할 것.
  • '이메일' 열에서 '@' 기호가 없는 불량 데이터 행은 삭제할 것.
  • '부서명' 열에서 '마케팅팀', 'MKT', '마케팅'으로 혼용된 단어를 모두 '마케팅본부'로 통일할 것."
[3단계: 새로운 인사이트 추출 및 포맷팅]

"전처리가 완료된 데이터를 바탕으로, '각 부서별 월평균 매출액'을 보여주는 피벗 테이블을 만들어 줘. 그리고 상위 3개 부서의 실적을 한눈에 볼 수 있는 깔끔한 막대그래프를 그려줘. 마지막으로 최종 정제된 전체 데이터를 내가 다운로드할 수 있게 엑셀 파일로 추출해 줘."

3. 궁극의 자동화: 구글 시트(Google Sheets) + OpenAI API 연동

ChatGPT 웹사이트에 접속하는 것조차 귀찮다면, 아예 팀에서 공용으로 쓰는 구글 시트에 AI를 심어버릴 수 있습니다. 구글 시트의 확장 프로그램인 'Apps Script'에 OpenAI API 키를 연결하는 방식입니다.

이 파이프라인을 구축하면, 구글 시트의 빈 셀에 =CHATGPT("A2 셀의 고객 불만 리뷰를 긍정/부정으로 분류해 줘")라는 커스텀 함수를 입력하는 것만으로 수천 개의 리뷰 데이터를 단 10초 만에 분석할 수 있습니다. 매일 아침 전날의 영업 데이터를 취합해야 하는 세일즈 팀이나, 수백 개의 고객 피드백을 분류해야 하는 CS 팀에게는 부서의 인건비를 절반으로 줄여주는 파괴적인 시스템입니다.

마치며: 데이터를 다루는 패러다임이 바뀐다

앞으로의 직장 생활에서 엑셀 단축키를 얼마나 빨리 누르느냐는 중요하지 않습니다. 방대한 데이터 속에서 "어떤 질문을 던져야 비즈니스에 유의미한 인사이트를 얻을 수 있는가"를 고민하는 '데이터 리터러시(Data Literacy)' 역량이 핵심입니다.

당장 오늘 오후, 엉켜있는 엑셀 파일을 ChatGPT에 던져보는 작은 실험을 시작해 보십시오. 마우스 클릭 백 번보다, 잘 쓴 프롬프트 한 줄이 당신을 훨씬 더 유능한 실무자로 만들어 줄 것입니다.