[포커스] 대학원에서 AI의 활용
이젠 연구실 풍경도 바뀌었다. 누군가는 실험대 위에 시약을 올리고, 누군가는 컴퓨터 앞에서 대화를 나눈다. AI는 더 이상 특별한 기술이 아니다. 일상이자 기본 도구다. AI는 편리하다. 하지만 아무리 편해도, ‘모르는 채로 쓰는 AI’는 무기가 아니라 오히려 위험이 될 수 있다. 그냥 써먹는 걸 넘어서, 어떻게 알고, 어디까지 믿고, 어떻게 활용할 것인가. 지금 대학원에서 AI를 접하고 있는 우리에게 꼭 필요한 이야기다.
AI 문장은 티가 난다. 그래서 위험하다.
무비판적으로 “오 좋네!” 하고 복붙 하는 순간, 그건 더 이상 네 글이 아니다. 실제로 나도 최근 들어 AI로 쓴 글 특유의 ‘매끄러운데 이상한 문장들’을 많이 보게 된다.
- 우리가 일상적으로 쓰지 않는 어휘
- 과하게 격식적이거나 문학적인 표현
- 논리적 연결은 있지만 정작 ‘주장의 온기’가 느껴지지 않는 서술
이건 단순히 문체 문제가 아니다. 글의 저자가 책임을 지지 않는 글은, 결국 설득력을 잃는다. 게다가 교수님들은 생각보다 훨씬 더 예리하다. "이건 네가 쓴 게 아니구나"라는 걸 단 한 문단만 읽고도 눈치챈다. 당장 나만 해도 후배들이 쓴 글을 보면, 특히 올해 들어서는 누가 봐도 “이건 AI가 쓴 문장이구나” 싶은 티가 바로 난다. 문장력뿐만 아니라, 평소 우리가 쓰지 않는 단어를 쓰고 어딘가 미묘하게 어색한 지점이 꼭 보인다.
그럼에도 불구하고, 써야 한다.
그럼에도, 난 이렇게 말하고 싶다. “AI를 안 쓰는 건 이제 게으른 것이다.” 우리는 정보 밀도가 높은 시대에 살고 있다. 하지만 이걸 어떻게 꺼내는가, 꺼낸 뒤에 어떻게 ‘내 것’ 으로 만드는가가 중요하다. 이제는 안 쓰면 바보다. 하지만 아무렇게나 쓰면 더 큰 바보다.
1. 내가 AI를 사용하는 순간들
글쓰기 초안, 생소한 개념 정리, 코드 생성. 이럴 때 AI는 꽤 쓸 만하다. AI는 아직 만능은 아니다. 아는 만큼 보이기 때문에, AI가 생성하는 무수한 거짓정보가 눈에 보일 때도 있다. 하지만 ‘여기까지는 믿을 수 있다’는 지점을 알게 되면 정말 강력한 도구가 된다.
내가 직접 써보며 느낀, 비교적 신뢰할 수 있는 순간들은 다음과 같다.
1-1. 글쓰기 초안을 잡을 때
보고서를 쓰거나 발표 자료를 만들 때, 처음 문장을 뱉어내는 건 정말 어렵다. 하지만 구조가 잡히고 방향이 생기면 그 다음은 훨씬 수월하다.
사실 나는 AI가 없는 시절 몇 년간 이 생활을 하면서 많은 학습이 되어 있다. 그래서 굳이 AI가 초안을 잡아주지 않아도 빈 한글, 워드파일에 내가 직접 타자를 쳐서 내용을 채워 나갈 수 있다. 하지만 요즘 신입생들을 보면 우리가 어느 정도 예시를 보여주며 교육을 해도 영 갈피를 못 잡는 경우가 많다. 당연히 이런 경험이 거의 없으니 어쩔 수 없는 부분이긴 하다. 하지만 마감일이 정해진 우리는 마냥 교육을 목적으로 글을 제대로 쓸 때까지 기다려줄 수 없다. 아마 본인들이 제일 답답할 것이다. 그럴 때 도움을 받아보자.
“이 주제로 서론을 쓰려고 해. 키워드는 ○○이고, 전하고 싶은 메시지는 ○○야. 초안 좀 만들어줘.”
이러면 기본적인 흐름을 만들어준다. 물론 문장 하나하나는 투박하고 때로는 어색하다. 하지만 내 생각을 정리하고 전개할 실마리를 던져준다는 점에서 큰 의미가 있다.
주의: 초안 그대로 복사해 쓰면 티 난다. 내가 다듬고 내 말로 다시 써야 진짜 내 글이 된다. 그리고 만약 그런 피드백이 없더라도 본인이 직접 작성하지 않은 글이라는 걸 선배들은 알면서 넘어가는 것이라고 믿어 의심치 않는다.
1-2. 생소한 이론이나 개념 정리할 때
가끔 실험 데이터를 해석하거나 문헌을 읽다 보면 처음 보거나 애매한 개념이 등장한다. 예를 들어 AB의 정의, AB-1과 AB-2의 공통점과 차이점 등. 이런 걸 그냥 인터넷에 검색하면 논문식 설명만 잔뜩 나오거나 흩어진 자료들이 대부분이고 초심자를 고려한 정리는 드물다. 그럴 때 이렇게 물어본다. “이 개념을 자연계 대학원생 수준에서 간단히 설명해 줘. 예시도 포함해서.”
AI는 여러 자료를 통합해 ‘지금 내가 이해할 수 있는 수준’ 으로 풀어준다. 이해한 뒤 다시 논문을 읽으면 받아들일 수 있는 정보의 폭이 달라진다. 교과서 대신 옆에서 설명해 주는 친절한 선배 같은 느낌이다. 물론, 이때도 모든 내용을 무분별하게 수용하면 안 된다. 참고용, 길잡이 역할이라는 것을 잊지 말자.
1-3. 통계 분석 코드 생성이 필요할 때
SPSS, STATA Python, R 등을 사용할 때 막상 분석을 설계했지만 어떤 명령어로 코딩 해야 할지 막힐 때가 있다. 그럴 때 나의 실험 조건에서 어떤 순서로 통계를 수행해야 하는지, 그 통계를 수행하기 위해 어떤 코드를 입력해야 하는지 구체적으로 요구하면 답을 얻을 수 있다. STATA, Python, R 등 명령어를 입력해야 하는 통계프로그램에서도 조건과 분석 방법을 구체적으로 요구하면 AI가 정제된 코드와 예제를 제공해 준다. 특히 내가 이미 어느 정도 내용을 이해하고 있고, '코드 초안만 있으면 된다'는 상황에서는 정말 유용하다. 다만, 실행 전 반드시 수정·검토해야 한다.
2. 반대로 AI가 독이 되는 경우
특히, 논문검색이나 요약의 기능은 실망한 적이 한두 번이 아니다. 논문 검색은 쉬워졌지만, 진짜 찾는 건 여전히 어렵다. AI가 발달하면서 검색은 분명 쉬워졌다. 이제는 논문 키워드를 몇 개만 입력하면, '관련 논문 리스트' 를 보여주기도 한다. 하지만 문제는, ‘관련 있는 것’과 ‘정말 내가 필요한 것’은 다르다.
2-1. AI 기반 논문 검색의 환상
예를 들어 “AAA of BBB” 같은 키워드를 입력하면, 그럴듯한 논문 5~10개를 쭉 보여준다. 그런데 막상 들어가서 보면?
- 주제는 비슷해도 연구 대상이나 실험 조건이 완전히 다른 경우
- 논문 제목만 관련돼 있고, 본문은 엉뚱한 방향으로 진행된 경우
- AI가 생성한 논문 요약이 실제 내용과 다르게 왜곡된 경우
이건 AI가 단어의 연관성만 보고 판단했기 때문이다. 내가 원하는 방향으로 2차 해석의 근거로 인용할 수 있는 논문 추천은 아직까지 부족한 편이다.
2-2. 논문 초록 및 open access자료기반 판단 위험성
대부분의 논문 검색 서비스는 초록이나 open access자료기반으로 수행된다. 물론 해당자료들도 양질의 자료일 수 있겠지만 상위 논문일수록 논문접근이 제한된다.이런 상위 저널논문도 초록까지는 오픈 되어있지만 초록은 내용이 생략 및 과장된 경우가 있어, 본문검토가 불가피하다.
- statistically significant라지만, 실제 p-value는 간신히 <0.05
- novel approach라고 썼지만, 기존 연구와 큰 차이 없음
- 실험 디자인이 초록에는 안 드러나기 때문에, 내 연구에 적용 가능한지 판단하기 어려움
결국 제목과 초록만으로 논문을 판단하면 위험할 수도 있다.
2-3. 논문 추천 기능의 알고리즘 편향
논문 추천 알고리즘은 기본적으로 많이 읽힌 논문, 많이 인용된 논문 내 이전 검색/열람 패턴을 기반으로 구성된다. 이건 편리하지만 동시에 문제도 있다. AI가 추천한 논문만 보게 되면, 진짜 내가 필요한 자료는 놓치게 될 수 있고, 계속 비슷한 분야, 비슷한 관점만 탐색하게 된다. 이건 마치 유튜브 알고리즘처럼, 확증편향의 루프에 빠지는 것과 같다. 그래서 어떻게 해야 할까? 1차 검색은 AI, 최종판단은 사람이 하자. 추천 논문 리스트는 참고만 하고, 결국 원문까지 읽고 내가 판단해야 한다.
간혹 AI가 추천해 준 논문 직접 검색해서 열어보면 없는 논문일 때도 있다. AI가 그럴듯하게 지어낸 논문을 추천해 줄 때가 생각보다 많다. 출처가 의심스러워 APA스타일 등 구체적으로 알려달라 해도 그럴듯하게 지어내서 알려준다. 그 출처로 검색해도 없는 논문이다. 그러니 무. 조. 건! 추천한 논문이 진짜인지 다시 검토해봐야 한다. 최소한 결과는 직접 읽자. 그리고 논문 내 Reference 리스트를 적극 활용하자. 무엇보다 출처가 확실한 '저자가 남긴 추천 목록'이기도 하다.
AI 등장 전에는, 먼저 내 연구와 가장 일치도가 높은 신뢰성 있는 논문을 찾고, 그 논문의 레퍼런스를 빠짐없이 확인하는 것이 당연한 절차였다. 요즘은 AI가 우선시가 되어 이 방법이 약간 뒷전이 된 것 같다. 하지만 이 정통법을 잊지 말자. AI는 결코 만능이 아니다.
프롬프트에 아무리 정교하게 써도 차마 담기지 않는 미묘한 부분이 있다. 그건 우리가 혼자가 아니라, 누군가의 기준에 맞춰 일해야 하는 현실 때문이지 않을까? 대학원에서 그 기준과 최종 결정권자는 대부분 교수님이다. 그리고 중요한 건 차마 말로 다 설명할 수 없는 ‘교수님 스타일’을 우리는 직접 수많은 피드백과 시행착오로 학습해 왔다는 사실이다. AI는 데이터로 학습했지만, 우리는 사람과 상황, 그 공기의 흐름까지 학습했다. 이 영역은 AI가 절대 범접할 수 없다.