Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020228226 - INSTRUMENTAL MUSIC DETECTION METHOD AND APPARATUS, AND STORAGE MEDIUM

Publication Number WO/2020/228226
Publication Date 19.11.2020
International Application No. PCT/CN2019/109638
International Filing Date 30.09.2019
IPC
G10L 25/78 2013.01
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/-G10L21/129
78Detection of presence or absence of voice signals
CPC
G10L 21/0272
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
21Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
02Speech enhancement, e.g. noise reduction or echo cancellation
0272Voice signal separating
G10L 25/03
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
03characterised by the type of extracted parameters
G10L 25/78
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
78Detection of presence or absence of voice signals
G10L 25/81
GPHYSICS
10MUSICAL INSTRUMENTS; ACOUSTICS
LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
25Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
78Detection of presence or absence of voice signals
81for discriminating voice from music
Applicants
  • 腾讯音乐娱乐科技(深圳)有限公司 TENCENT MUSIC ENTERTAINMENT TECHNOLOGY (SHENZHEN) CO., LTD [CN]/[CN]
Inventors
  • 王征韬 WANG, Zhengtao
Agents
  • 深圳翼盛智成知识产权事务所(普通合伙) ESSEN PATENT & TRADEMARK AGENCY
Priority Data
201910398945.614.05.2019CN
Publication Language Chinese (ZH)
Filing Language Chinese (ZH)
Designated States
Title
(EN) INSTRUMENTAL MUSIC DETECTION METHOD AND APPARATUS, AND STORAGE MEDIUM
(FR) PROCÉDÉ ET APPAREIL DE DÉTECTION DE MUSIQUE INSTRUMENTALE, ET SUPPORT D'INFORMATIONS
(ZH) 一种纯音乐检测方法、装置及存储介质
Abstract
(EN)
An instrumental music detection method and apparatus, and a storage medium. The method comprises: acquiring audio to be tested (201); performing human voice separation processing on said audio to obtain an audio segment to be processed (202); then extracting audio features from said audio segment, the audio features comprising Mel features and human voice ratio features (203); inputting the audio features into a trained human voice detection network model (204); acquiring an output result of the trained human voice detection network model (205); and if determined, according to the output result, that said audio segment does not contain a human voice, then determining that said audio is instrumental music (206). The described method performs instrumental music detection on an audio segment separated from audio to be tested, without needing to perform detection on an entire song; the length of said audio is relatively short, and the method may improve the accuracy of instrumental music detection.
(FR)
L'invention concerne un procédé et un appareil de traitement de musique instrumentale, ainsi qu'un support d'informations. Le procédé consiste : à acquérir un audio à tester (201) ; à effectuer un traitement de séparation de voix humaine sur ledit audio pour obtenir un segment audio à traiter (202) ; puis à extraire des caractéristiques audio dudit segment audio, les caractéristiques audio comprenant des caractéristiques Mel et des caractéristiques de rapport de voix humaine (203) ; à entrer les caractéristiques audio dans un modèle de réseau de détection de voix humaine entraîné (204) ; à acquérir un résultat de sortie du modèle de réseau de détection de voix humaine entraîné (205) ; et s'il est déterminé, selon le résultat de sortie, que ledit segment audio ne contient pas de voix humaine, à déterminer alors que ledit audio est une musique instrumentale (206). Le procédé décrit selon l'invention effectue une détection de musique instrumentale sur un segment audio séparé de l'audio à tester, sans qu'il soit nécessaire d'effectuer une détection sur une chanson entière ; la longueur dudit audio est relativement courte, et le procédé peut améliorer la précision de la détection de musique instrumentale.
(ZH)
一种纯音乐检测方法、装置及存储介质,所示方法包括:获取待检测音频(201);对所述待检测音频进行人声分离处理,得到待处理音频片段(202);然后提取所述待处理音频片段的音频特征,所述音频特征包括梅尔mel特征及人声占比特征(203);将所述音频特征输入训练后的人声检测网络模型中(204);获取所述训练后的人声检测网络模型的输出结果(205);若根据所述输出结果确定所述待处理音频片段不包含人声,则确定所述待检测音频属于纯音乐(206)。其对从待检测音频中分离出来的音频片段进行纯音乐检测,不需要整曲检测,需要检测的音频长度较短,可以提高纯音乐检测的准确率。
Latest bibliographic data on file with the International Bureau