팀명
Menocat
팀원 명단
편고운, 안유진, 김태현
지도교수
이성호 교수님
작품 배경 및 목적
Code clone 은 프로그램 유지보수 측면에서 치명적인 문제를 발생시킬 수 있다. 따라서 Clone detection 은 굉장히 중요한 문제이다. 수많은 관련 연구에도 불구하고 서로 다른 언어에서의 Clone detection 은 큰 성과를 거두지 못하고 있는 실정이다. 이에, 서로 다른 언어간의 Code Clone Detection 도구를 만드는 것이 몬 연구의 목적이다.
작품 내용
본 연구는 LLVM-IR 을 사용하여 LLVM 을 지원하는 언어에 대하여 전처리 과정을 최소화한다. LLVM-IR 에서 최소한의 Semantic 정보만을 남기기 위하여 LLVM의 Instruction name 과 Operand type 으로 LLVM-IR 을 추상화하고 (이하 LLVM-IR abstraction), 이 추상화된 정보가 기존 코드의 Semantic을 잘 유지하는 것을 Clone detection 으로 확인한다. 또 이 정보를 최근 많은 분야에서 높은 성능을 만들어내고 있는 LLM (CodeBERT) 에서 Fine-tuning 하여 높은 정확도로 Cross-Language Clone detection 을 수행한다.
Comments