--'Just do something,give destiny a reason to stir.'
开一篇blog记录一下我对于video-based world model的期待
1.给一张环境图片,给若干个人物图片,让给定人物在环境中交互。
2.根据用户的手势进行交互