если я понял про "вставка" - "NEST", когда создаете, то внутри созданной секвенции будет все как надо вместе со звуком. Почему то тут же на таймлайне после создания она отображается только как видео.
Если у вас трудности в кодировании - не нужно все, что на таймлане кодировать, то выделите рабочую область (над тайм лайном полоска) и только это выделенное и будет кодироваться.