我理解的裸听就是完全没有任何的画面,肢体动作,只是单独听到了声音,然后直接就能迅速反应出来,并做出正确表示。比如说有个人远远的中文喊了他一声,说了一件什么事,然后他迅速就转头回应。但是这样的状态,如果用英语的话,目前我们还是没有实现的