为什么用目前的软件把mp3转变为mid格式以后,比较乱糟糟?

提问于
最后更新于
浏览 1,943次
登录并提问
2

为什么用目前的经典软件WIDI 3.0 Pro把mp3转变为mid格式以后,比较乱糟糟,全部是钢琴音色,并且拍节不大对头,有细微的差异,与原来的mid不一样?即使是把音色定为原来的mp3的音色设计,也不能够变为实现mp3本来一清二楚的面目?旋律‘卡’,有一点拖泥带水,可以说是惨不忍睹。

v2-e43f2a95f1147ed2504baf7199afe291_b.jpg

班明峰
XP 8073
班明峰
提问于 Mar 5, 2021, 12:02:13 AM
6

举个例子。去饭店点了一份水煮鱼,普通人吃了觉得好吃,有点儿厨艺经验的能猜出用了什么调料,大厨能估计出各种调料放了多少。但没有人能说出做这道菜时真正用了什么调料,以及用量是多少。

再举个例子。10x10=100, 5x20=100, 2.5x40=100, (100/7)x7=100. 但给个数字100,问是那两个数相乘得出的,谁也说不出来。

总之,并不是所有事情都是可逆过程。做菜,做乘法,扒谱,图像识别,都是这样。

华北kingsky
XP 1035
华北kingsky
回答于 3/5/21, 10:49 AM
3

楼主可以去买本书来看一下:https://item.jd.com/12626501.html

《音频音乐与计算机的交融:音频音乐技术》

这本书里除了简单介绍传统的一些音乐声学、MIDI系统等的内容,更多地大量介绍了近些年有关计算机音频技术的前沿内容,尤其是结合机器学习、人工智能、大数据等新兴技术来研究音乐与音频。引用某东的简介内容:

近20年来,随着数字音频音乐的急剧增加,形成了音乐科技/音乐人工智能与计算机听觉/AI声学这一多领域交叉到新兴学科。本书全面介绍其主要内容,包括音频及音乐基础,音频调整及音频信号处理,常用机器学习技术,音乐信息检索MIR中到音高/旋律提取、自动记谱、节奏分析、和声分析、歌声信息处理、音乐搜索、音乐结构分析、音乐情感计算、音乐推荐、音乐分类,音乐生成中的自动作曲、歌声合成、数字乐器声合成,以及音乐演奏数据与建模,一般音频计算机听觉,音频信息安全,音频与视频和文本到融合,音乐制作、声景及声音设计,音乐录音、计算机交互与声音艺术,实用工具等内容。本书适合作为文理科涉及声音到课程教材及科研参考资料。

华北kingsky
XP 1035
华北kingsky
回答于 3/5/21, 7:38 PM
1

我设想的把mp3转变为mid格式的方法是,分为两部进行:1、由mid转变为mp3时,乐器音色和节奏分别转变为mid格式。分别保留。不采用用现在的“‘半成功’的只能够转变钢琴曲的软件”,而是‘分部进行’:第一步,记录节奏,软件界面用方块的“长度”表示音符的‘长长短短’的时段;第二步,只是单一记录mp3的音高,不论什么音色统一转变为谐波的音高(如同林立的高楼大厦),设计软件时,把复杂的人声(其波形很复杂)过滤掉;得到简单波形记录,把mp3用不超过128种音色的[包含节奏、音色两个因素]的两个‘种子’(分解为水平线条与竖直线分别记录在软件内部)显示得到新的模型(简称‘L’),‘L’相当于孙悟空的‘节奏、音色分身法’,试听时‘mp3分解’时仅听到如同‘单一的钢琴中央c的长长短短的节奏音’,mp3已经‘必要性’地面目全非了;第三步,由我们音乐爱好者老百姓手动去完成mid格式的‘合并’:在界面中,在‘中央c的节奏音’的‘方框’内填入128种音色其中一种,‘填入’某一音轨。就可以由mp3节奏准确地还原为mid了。(因为目前想一步到位把mp3转变为mid格式非常困难。往往是没有过滤,把一些杂波也‘翻译为mid格式了’所以节奏乱糟糟。而无奈用此‘过滤法’原理比喻,相当于[张三、李四同时用五线谱记录某歌声,张三专门用abcde......‘按格填入法’记录节奏;李四也‘按格填入法’专门用ABCDE......记录音高,‘回到家’后两个人再按‘表格’搞‘密码对号入座’——把Aa、Bb、Cc、Dd、Ee、互相搭配,翻译后,就可以得到‘非简谱、非五线谱’的 ‘特色乐谱’了,再‘翻译’为电脑音乐mid格式。相信用软件此‘班式’的‘转变笨办法’是可行的。用电脑搞小菜一碟。首先搞‘少慢差费’分解以后再合成,用比较简单化的‘两部法’合成的界面,虽然复杂而‘笨’一些,相信是可以完成把mp3转变为mid格式的任务。将来可再升级。并且新的mid效果比mp3原来单一的音色的效果还要丰富。新的mid格式也可以作为伴奏带使用。

班明峰
XP 8073
班明峰
回答于 3/9/21, 11:08 PM
1

题主肯定知道, MP3 里面记录的是音频信号,而 MIDI 里面记录的是音符数据,完全不是同一类东西。要通过音频波形识别出音符,这个在传统技术上来说真的是太难了。

现在用人工智能技术,倒是实现了比较准确的钢琴曲转换。但对于多重乐器混杂的,还是很有挑战。

riverlet
XP 1738
riverlet
回答于 3/5/21, 12:15 AM
0

<h1>WIDI的转换效果不好,是因为他的机器学习程度不够高,技术不够先进,因为他有很多的乐器,所以识别出来很不准</h1>

独自听听
XP 1523
独自听听
回答于 4/24/21, 7:38 PM
0

多乐器,多声部音乐的频谱过于复杂,计算机无法准确分辨基音和泛音。
woshirenzhp
XP 523
woshirenzhp
回答于 3/17/21, 10:39 PM
0

只能钢琴曲转换别的都不行,其它乐器声音都转不出来,而且太难听

回答于 3/12/21, 10:34 AM
0

用widi去做mp3转midi还是比较可以的,虽说有一些杂音
但是稍加修改就可以
可是节奏感太乱的不行
回答于 3/9/21, 8:26 PM
0
midi本来就是抓住音高的,不能转化的很细微,再者这是转录的,不清楚很正常
Happy_142400
XP 18
Happy_142400
回答于 3/7/21, 10:59 AM
0
现在mp3转midi效果最好的就是钢琴曲,多个音色出现确实难识别
fireball
XP 1988
fireball
回答于 3/5/21, 6:35 PM

您的回答

登录以回答

这儿是 MidiShow 问答区,欢迎您请教或帮大家解决关于音乐创作、MIDI 应用、MIDI 技术等音乐相关的问题。

问答区积分规则如下:


  1. 提问、回答或自问自答积分均不变
  2. 问题被赞成 : +10
  3. 问题被反对 : 提问者 -2,点击反对者不扣分
  4. 回答被赞成 : +10
  5. 回答被反对 : 回答者 -2,点击反对者 -1
  6. 提问者选出满意回答 :回答者 +15 ,提问者 +2

参与问答前请阅读:问答区玩法规则