어제는 multimodal에 관련된 내용이 많았습니다. 오늘의 첫 발표는 DeepSpeed라는 주제를 시작으로 발표를 시작하였는데, Deepspeed 라이브러리를 통해 딥러닝의 모델의 학습과 추론을 보다 손 쉽게 해준다는 내용을 처음 접하였습니다. 발표의 내용만으로 다 이해가 가지 않기에 궁금증을 안고 구글링하였는데 공식 github에 배포된 코드들을 구경할 수 있었습니다. DeepSpeed는 모델 Compression에서 또한 강점을 가지고 있었고 최근에 pretrained된 language 모델을 손쉽게 사용할 수 있게 제공하는 hugging face 라이브러리하고 호환성이 뛰어난 것을 확인하였습니다.

https://github.com/microsoft/DeepSpeed

 


 

 

Conditional Motion In-betweening

2번째 발표는 Meta AI (이전 Facebook AI Research)의 원정담 연사님께서 "motion and behavior generation for virtual avatar in metaverse" 주제를 가지고 진행해 주셨습니다. 발표의 내용은 3d 아바타를 가지고 진행한 실험을 설명해 주셨습니다. Conditional Motion In-betweening의 제목의 논문은 transformer의 인코더를 핵심으로 사용하였으며 정확하게 어떤 메커니즘을 기반으로 3d avatar에 적용 되었는지는 추후 읽어볼 예정입니다. 최근에 메타버스가 각광을 받음에 따라서 발표를 들으면서 실제 연구는 어떻게 이루어지고 있는지 흥미롭게 들을 수 있었습니다.

 


Time Discretization-Invariant Safe Action Repetition for Policy Gradient Methods

오후에는 작년에 세미나를 진행해 주셨던 김건희 교수님께서 Unsupervised Skillful Discovery에 대한 연구 및 내용을 공유해 주셨습니다. 본 연구는 Reinforcement learning 강화학습에 관련된 내용들이 주를 이었습니다. 발표를 시작하면서 MDP의 예를 들으면서 time discretization을 설명해 주셨습니다. discretization은 RL의 성능에 critical하게 영향을 미친다고 합니다. 일종의 하이퍼파라미터를 조정하였을때 성능이 달라지는 것과도 비슷하다는 생각이 들었습니다. 연구에서는 delta를 줄여서 fine gradient control를 에이전트에게 부여할 수 있습니다. 이전에 Q learning과 policy gradient 방법론들은 delta값이 너무 작으면 성능이 좋게 나오지 않는다고 하였습니다.  

 


오늘도 들었던 내용들을 정리하면서 논문 쇼핑 장바구니에 읽어보고 싶은 논문을 가득채운 하루였습니다.

+ Recent posts