/src/ffmpeg/libavformat/iamfdec.c

Source
/*
 * Immersive Audio Model and Formats demuxer
 * Copyright (c) 2023 James Almer <jamrial@gmail.com>
 *
 * This file is part of FFmpeg.
 *
 * FFmpeg is free software; you can redistribute it and/or
 * modify it under the terms of the GNU Lesser General Public
 * License as published by the Free Software Foundation; either
 * version 2.1 of the License, or (at your option) any later version.
 *
 * FFmpeg is distributed in the hope that it will be useful,
 * but WITHOUT ANY WARRANTY; without even the implied warranty of
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
 * Lesser General Public License for more details.
 *
 * You should have received a copy of the GNU Lesser General Public
 * License along with FFmpeg; if not, write to the Free Software
 * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
 */

#include "libavutil/avassert.h"
#include "libavutil/intreadwrite.h"
#include "avformat.h"
#include "demux.h"
#include "iamf.h"
#include "iamf_reader.h"
#include "iamf_parse.h"
#include "internal.h"

//return < 0 if we need more data
static int get_score(const uint8_t *buf, int buf_size, enum IAMF_OBU_Type type, int *seq)
{
    if (type == IAMF_OBU_IA_SEQUENCE_HEADER) {
        if (buf_size < 4 || AV_RB32(buf) != MKBETAG('i','a','m','f'))
            return 0;
        *seq = 1;
        return -1;
    }
    if (type >= IAMF_OBU_IA_CODEC_CONFIG && type <= IAMF_OBU_IA_TEMPORAL_DELIMITER)
        return *seq ? -1 : 0;
    if (type >= IAMF_OBU_IA_AUDIO_FRAME && type <= IAMF_OBU_IA_AUDIO_FRAME_ID17)
        return *seq ? AVPROBE_SCORE_EXTENSION + 1 : 0;
    return 0;
}

static int iamf_probe(const AVProbeData *p)
{
    unsigned obu_size;
    enum IAMF_OBU_Type type;
    int seq = 0, cnt = 0, start_pos;
    int ret;

    while (1) {
        int size = ff_iamf_parse_obu_header(p->buf + cnt, p->buf_size - cnt,
                                            &obu_size, &start_pos, &type,
                                            NULL, NULL);
        if (size < 0)
            return 0;

        ret = get_score(p->buf + cnt + start_pos,
                        p->buf_size - cnt - start_pos,
                        type, &seq);
        if (ret >= 0)
            return ret;

        cnt += FFMIN(size, p->buf_size - cnt);
    }
    return 0;
}

static int iamf_read_header(AVFormatContext *s)
{
    IAMFDemuxContext *const c = s->priv_data;
    IAMFContext *const iamf = &c->iamf;
    int ret;

    ret = ff_iamfdec_read_descriptors(iamf, s->pb, INT_MAX, s);
    if (ret < 0)
        return ret;

    for (int i = 0; i < iamf->nb_audio_elements; i++) {
        IAMFAudioElement *audio_element = iamf->audio_elements[i];
        AVStreamGroup *stg = avformat_stream_group_create(s, AV_STREAM_GROUP_PARAMS_IAMF_AUDIO_ELEMENT, NULL);

        if (!stg)
            return AVERROR(ENOMEM);

        av_iamf_audio_element_free(&stg->params.iamf_audio_element);
        stg->id = audio_element->audio_element_id;
        /* Transfer ownership */
        stg->params.iamf_audio_element = audio_element->element;
        audio_element->element = NULL;

        for (int j = 0; j < audio_element->nb_substreams; j++) {
            IAMFSubStream *substream = &audio_element->substreams[j];
            AVStream *st = avformat_new_stream(s, NULL);

            if (!st)
                return AVERROR(ENOMEM);

            ret = avformat_stream_group_add_stream(stg, st);
            if (ret < 0)
                return ret;

            ret = avcodec_parameters_copy(st->codecpar, substream->codecpar);
            if (ret < 0)
                return ret;

            if (!i && !j && audio_element->layers[0].substream_count == 1)
                st->disposition |= AV_DISPOSITION_DEFAULT;
            else if (audio_element->nb_layers > 1 || audio_element->layers[0].substream_count > 1)
                st->disposition |= AV_DISPOSITION_DEPENDENT;
            st->id = substream->audio_substream_id;
            avpriv_set_pts_info(st, 64, 1, st->codecpar->sample_rate);
        }
    }

    for (int i = 0; i < iamf->nb_mix_presentations; i++) {
        IAMFMixPresentation *mix_presentation = iamf->mix_presentations[i];
        AVStreamGroup *stg = avformat_stream_group_create(s, AV_STREAM_GROUP_PARAMS_IAMF_MIX_PRESENTATION, NULL);
        const AVIAMFMixPresentation *mix = mix_presentation->cmix;

        if (!stg)
            return AVERROR(ENOMEM);

        av_iamf_mix_presentation_free(&stg->params.iamf_mix_presentation);
        stg->id = mix_presentation->mix_presentation_id;
        /* Transfer ownership */
        stg->params.iamf_mix_presentation = mix_presentation->mix;
        mix_presentation->mix = NULL;

        for (int j = 0; j < mix->nb_submixes; j++) {
            const AVIAMFSubmix *sub_mix = mix->submixes[j];

            for (int k = 0; k < sub_mix->nb_elements; k++) {
                const AVIAMFSubmixElement *submix_element = sub_mix->elements[k];
                AVStreamGroup *audio_element = NULL;

                for (int l = 0; l < s->nb_stream_groups; l++)
                    if (s->stream_groups[l]->type == AV_STREAM_GROUP_PARAMS_IAMF_AUDIO_ELEMENT &&
                        s->stream_groups[l]->id == submix_element->audio_element_id) {
                        audio_element = s->stream_groups[l];
                        break;
                    }
                av_assert0(audio_element);

                for (int l = 0; l < audio_element->nb_streams; l++) {
                    ret = avformat_stream_group_add_stream(stg, audio_element->streams[l]);
                    if (ret < 0 && ret != AVERROR(EEXIST))
                        return ret;
                }
            }
        }
    }

    if (!s->nb_streams)
        return AVERROR_INVALIDDATA;

    return 0;
}

static int iamf_read_packet(AVFormatContext *s, AVPacket *pkt)
{
    IAMFDemuxContext *const c = s->priv_data;
    int ret;

    ret = ff_iamf_read_packet(s, c, s->pb, INT_MAX, 0, pkt);
    if (ret < 0)
        return ret;

    return 0;
}

static int iamf_read_close(AVFormatContext *s)
{
    IAMFDemuxContext *const c = s->priv_data;

    ff_iamf_read_deinit(c);

    return 0;
}

const FFInputFormat ff_iamf_demuxer = {
    .p.name         = "iamf",
    .p.long_name    = NULL_IF_CONFIG_SMALL("Raw Immersive Audio Model and Formats"),
    .p.extensions   = "iamf",
    .p.flags        = AVFMT_GENERIC_INDEX | AVFMT_NO_BYTE_SEEK | AVFMT_NOTIMESTAMPS | AVFMT_SHOW_IDS,
    .priv_data_size = sizeof(IAMFDemuxContext),
    .flags_internal = FF_INFMT_FLAG_INIT_CLEANUP,
    .read_probe     = iamf_probe,
    .read_header    = iamf_read_header,
    .read_packet    = iamf_read_packet,
    .read_close     = iamf_read_close,
};

Line	Count	Source
1		/*
2		* Immersive Audio Model and Formats demuxer
3		* Copyright (c) 2023 James Almer <jamrial@gmail.com>
4		*
5		* This file is part of FFmpeg.
6		*
7		* FFmpeg is free software; you can redistribute it and/or
8		* modify it under the terms of the GNU Lesser General Public
9		* License as published by the Free Software Foundation; either
10		* version 2.1 of the License, or (at your option) any later version.
11		*
12		* FFmpeg is distributed in the hope that it will be useful,
13		* but WITHOUT ANY WARRANTY; without even the implied warranty of
14		* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
15		* Lesser General Public License for more details.
16		*
17		* You should have received a copy of the GNU Lesser General Public
18		* License along with FFmpeg; if not, write to the Free Software
19		* Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
20		*/
21
22		#include "libavutil/avassert.h"
23		#include "libavutil/intreadwrite.h"
24		#include "avformat.h"
25		#include "demux.h"
26		#include "iamf.h"
27		#include "iamf_reader.h"
28		#include "iamf_parse.h"
29		#include "internal.h"
30
31		//return < 0 if we need more data
32		static int get_score(const uint8_t buf, int buf_size, enum IAMF_OBU_Type type, int seq)
33	544k	{
34	544k	if (type == IAMF_OBU_IA_SEQUENCE_HEADER) {
35	50.7k	if (buf_size < 4 \|\| AV_RB32(buf) != MKBETAG('i','a','m','f'))
36	49.8k	return 0;
37	887	*seq = 1;
38	887	return -1;
39	50.7k	}
40	493k	if (type >= IAMF_OBU_IA_CODEC_CONFIG && type <= IAMF_OBU_IA_TEMPORAL_DELIMITER)
41	256k	return *seq ? -1 : 0;
42	237k	if (type >= IAMF_OBU_IA_AUDIO_FRAME && type <= IAMF_OBU_IA_AUDIO_FRAME_ID17)
43	223k	return *seq ? AVPROBE_SCORE_EXTENSION + 1 : 0;
44	13.5k	return 0;
45	237k	}
46
47		static int iamf_probe(const AVProbeData *p)
48	936k	{
49	936k	unsigned obu_size;
50	936k	enum IAMF_OBU_Type type;
51	936k	int seq = 0, cnt = 0, start_pos;
52	936k	int ret;
53
54	946k	while (1) {
55	946k	int size = ff_iamf_parse_obu_header(p->buf + cnt, p->buf_size - cnt,
56	946k	&obu_size, &start_pos, &type,
57	946k	NULL, NULL);
58	946k	if (size < 0)
59	401k	return 0;
60
61	544k	ret = get_score(p->buf + cnt + start_pos,
62	544k	p->buf_size - cnt - start_pos,
63	544k	type, &seq);
64	544k	if (ret >= 0)
65	534k	return ret;
66
67	9.64k	cnt += FFMIN(size, p->buf_size - cnt);
68	9.64k	}
69	0	return 0;
70	936k	}
71
72		static int iamf_read_header(AVFormatContext *s)
73	2.12k	{
74	2.12k	IAMFDemuxContext *const c = s->priv_data;
75	2.12k	IAMFContext *const iamf = &c->iamf;
76	2.12k	int ret;
77
78	2.12k	ret = ff_iamfdec_read_descriptors(iamf, s->pb, INT_MAX, s);
79	2.12k	if (ret < 0)
80	1.05k	return ret;
81
82	2.07k	for (int i = 0; i < iamf->nb_audio_elements; i++) {
83	1.00k	IAMFAudioElement *audio_element = iamf->audio_elements[i];
84	1.00k	AVStreamGroup *stg = avformat_stream_group_create(s, AV_STREAM_GROUP_PARAMS_IAMF_AUDIO_ELEMENT, NULL);
85
86	1.00k	if (!stg)
87	0	return AVERROR(ENOMEM);
88
89	1.00k	av_iamf_audio_element_free(&stg->params.iamf_audio_element);
90	1.00k	stg->id = audio_element->audio_element_id;
91		/* Transfer ownership */
92	1.00k	stg->params.iamf_audio_element = audio_element->element;
93	1.00k	audio_element->element = NULL;
94
95	3.28k	for (int j = 0; j < audio_element->nb_substreams; j++) {
96	2.27k	IAMFSubStream *substream = &audio_element->substreams[j];
97	2.27k	AVStream *st = avformat_new_stream(s, NULL);
98
99	2.27k	if (!st)
100	0	return AVERROR(ENOMEM);
101
102	2.27k	ret = avformat_stream_group_add_stream(stg, st);
103	2.27k	if (ret < 0)
104	0	return ret;
105
106	2.27k	ret = avcodec_parameters_copy(st->codecpar, substream->codecpar);
107	2.27k	if (ret < 0)
108	0	return ret;
109
110	2.27k	if (!i && !j && audio_element->layers[0].substream_count == 1)
111	842	st->disposition \|= AV_DISPOSITION_DEFAULT;
112	1.43k	else if (audio_element->nb_layers > 1 \|\| audio_element->layers[0].substream_count > 1)
113	1.42k	st->disposition \|= AV_DISPOSITION_DEPENDENT;
114	2.27k	st->id = substream->audio_substream_id;
115	2.27k	avpriv_set_pts_info(st, 64, 1, st->codecpar->sample_rate);
116	2.27k	}
117	1.00k	}
118
119	1.33k	for (int i = 0; i < iamf->nb_mix_presentations; i++) {
120	262	IAMFMixPresentation *mix_presentation = iamf->mix_presentations[i];
121	262	AVStreamGroup *stg = avformat_stream_group_create(s, AV_STREAM_GROUP_PARAMS_IAMF_MIX_PRESENTATION, NULL);
122	262	const AVIAMFMixPresentation *mix = mix_presentation->cmix;
123
124	262	if (!stg)
125	0	return AVERROR(ENOMEM);
126
127	262	av_iamf_mix_presentation_free(&stg->params.iamf_mix_presentation);
128	262	stg->id = mix_presentation->mix_presentation_id;
129		/* Transfer ownership */
130	262	stg->params.iamf_mix_presentation = mix_presentation->mix;
131	262	mix_presentation->mix = NULL;
132
133	602	for (int j = 0; j < mix->nb_submixes; j++) {
134	340	const AVIAMFSubmix *sub_mix = mix->submixes[j];
135
136	519	for (int k = 0; k < sub_mix->nb_elements; k++) {
137	179	const AVIAMFSubmixElement *submix_element = sub_mix->elements[k];
138	179	AVStreamGroup *audio_element = NULL;
139
140	184	for (int l = 0; l < s->nb_stream_groups; l++)
141	184	if (s->stream_groups[l]->type == AV_STREAM_GROUP_PARAMS_IAMF_AUDIO_ELEMENT &&
142	184	s->stream_groups[l]->id == submix_element->audio_element_id) {
143	179	audio_element = s->stream_groups[l];
144	179	break;
145	179	}
146	179	av_assert0(audio_element);
147
148	883	for (int l = 0; l < audio_element->nb_streams; l++) {
149	704	ret = avformat_stream_group_add_stream(stg, audio_element->streams[l]);
150	704	if (ret < 0 && ret != AVERROR(EEXIST))
151	0	return ret;
152	704	}
153	179	}
154	340	}
155	262	}
156
157	1.06k	if (!s->nb_streams)
158	102	return AVERROR_INVALIDDATA;
159
160	966	return 0;
161	1.06k	}
162
163		static int iamf_read_packet(AVFormatContext s, AVPacket pkt)
164	33.5k	{
165	33.5k	IAMFDemuxContext *const c = s->priv_data;
166	33.5k	int ret;
167
168	33.5k	ret = ff_iamf_read_packet(s, c, s->pb, INT_MAX, 0, pkt);
169	33.5k	if (ret < 0)
170	1.70k	return ret;
171
172	31.8k	return 0;
173	33.5k	}
174
175		static int iamf_read_close(AVFormatContext *s)
176	2.12k	{
177	2.12k	IAMFDemuxContext *const c = s->priv_data;
178
179	2.12k	ff_iamf_read_deinit(c);
180
181	2.12k	return 0;
182	2.12k	}
183
184		const FFInputFormat ff_iamf_demuxer = {
185		.p.name = "iamf",
186		.p.long_name = NULL_IF_CONFIG_SMALL("Raw Immersive Audio Model and Formats"),
187		.p.extensions = "iamf",
188		.p.flags = AVFMT_GENERIC_INDEX \| AVFMT_NO_BYTE_SEEK \| AVFMT_NOTIMESTAMPS \| AVFMT_SHOW_IDS,
189		.priv_data_size = sizeof(IAMFDemuxContext),
190		.flags_internal = FF_INFMT_FLAG_INIT_CLEANUP,
191		.read_probe = iamf_probe,
192		.read_header = iamf_read_header,
193		.read_packet = iamf_read_packet,
194		.read_close = iamf_read_close,
195		};

Coverage Report

Created: 2026-02-14 06:59