강화학습 기반 경주용 자율주행 모델의 학습 결과 비교 및 분석
- 최원준 박병휘 장신형
- 2023년 11월 12일
- 1분 분량
최종 수정일: 2023년 11월 14일
팀명
졸프꺾기
팀원 명단
최원준 박병휘 장신형
지도교수
김형신 교수님
작품 배경 및 목적
자율주행 모델의 경주 주행 기록 단축
작품 내용
본 연구는 강화학습 기반 경주용 자율주행 모델의 학습 결과를 비교 및 분석한다. 해당 모델은 주어진 트랙을 가장 빠르게 완주하는 것을 목적으로 보상 함수가 정의된다. 이때 Agent의 제 어 인자로는 speed와 steering_angle이 존재하며, 본 연구에서는 이 둘을 독립적으로 활용
한 두 가지 모델을 제시한다. 첫 번째 모델은 매 step에서의 speed가 클수록 많은 보상을 얻 도록 설계한 'Speed-Based Model (SBM)'이고, 두 번째 모델은 매 step에서의 Agent의 주 행 방향이 최적의 경로를 만족하는 방향과 유사한 경우 보상을 얻도록 설계한 'Angle-Based Model (ABM)'이다. 가상 환경에서 AWS의 기본 모델과 두 모델의 성능을 비교하였다. SBM 은 보상을 최대한으로 얻기 위해 Agent가 지그재그 형태로 주행하였으나, 주행시간이 비교적 짧았다. ABM은 상대적으로 짧은 경로로 주행하였으나, Agent가 더 많은 보상을 얻기 위해 느린 속도로 주행해 Action의 횟수를 늘려 의도한 바와 다르게 동작했다.

Comments