LP-MusicCaps 是一种基于 LLM 的伪音乐字幕生成方法。该项目的目标是为音乐生成字幕。它通过将大型语言模型应用于标签数据集,生成了一个大规模的音乐字幕数据集,为研究者们提供了更多的训练数据,以便成功训练音乐字幕生成模型。
项目地址:https://github.com/seungheondoh/lp-music-caps
其核心功能包括:
1. 标签到字幕:利用现有标签,使用 OpenAI 的 GPT-3.5Turbo API 生成高质量、上下文相关的音乐字幕。
2. 音频到字幕:使用音乐音频和伪字幕对,训练端到端的跨模态编码器 - 解码器模型,用于音乐字幕生成。
3.系统性评估方案:LP-MusicCaps 提出了一种系统性评估方案,通过多种定量评估指标和人工评估来评估大规模音乐字幕数据集的质量。
4.零样本学习和迁移学习支持:LP-MusicCaps 训练的模型在零样本学习和迁移学习场景下表现良好,证明了基于大型语言模型的伪字幕的有效性。
相关标签: LP MusicCaps 基于 LLM 的伪音乐字幕生成方法
评论列表 (条)