top of page

LLvM-CD: Cross-Language Code Clone Detection in LLVM-IR with Deep Learning




팀명

Menocat


팀원 명단

편고운, 안유진, 김태현


지도교수

이성호 교수님


작품 배경 및 목적

Code clone 은 프로그램 유지보수 측면에서 치명적인 문제를 발생시킬 수 있다. 따라서 Clone detection 은 굉장히 중요한 문제이다. 수많은 관련 연구에도 불구하고 서로 다른 언어에서의 Clone detection 은 큰 성과를 거두지 못하고 있는 실정이다. 이에, 서로 다른 언어간의 Code Clone Detection 도구를 만드는 것이 몬 연구의 목적이다.


작품 내용

본 연구는 LLVM-IR 을 사용하여 LLVM 을 지원하는 언어에 대하여 전처리 과정을 최소화한다. LLVM-IR 에서 최소한의 Semantic 정보만을 남기기 위하여 LLVM의 Instruction name 과 Operand type 으로 LLVM-IR 을 추상화하고 (이하 LLVM-IR abstraction), 이 추상화된 정보가 기존 코드의 Semantic을 잘 유지하는 것을 Clone detection 으로 확인한다. 또 이 정보를 최근 많은 분야에서 높은 성능을 만들어내고 있는 LLM (CodeBERT) 에서 Fine-tuning 하여 높은 정확도로 Cross-Language Clone detection 을 수행한다.






조회수 66회댓글 0개

Comments


bottom of page