Aspects avancés du timing de karaoké

Sur cette page nous allons voir plus en détail quels indices le spectre de son bleu de Aegisub peut vous donner pour rendre votre timing plus précis et efficace. Ainsi, certains aspects mentionnés dans le tutorial de base sera expliqué plus en détail ici.

Temps

La plupart des syllabes dans les chansons seront sur un temps et ainsi devraient être synchronisées selon ce dernier. Cependant, reconnaître le temps n’est pas toujours facile.

C’est quoi le temps ?

Le temps est un terme musical qui n’est pas très bien défini.

“Le rythme auquel un auditeur tape du pied en écoutant une chanson” est l’interprétation al plus pratique.

Pour en savoir plus, consultez la page Wikipedia).

Image de tempo Image de tempo

Sur l’image ci-dessus le temps est marqué avec des lignes rouges semi-transparentes.

Parfois les temps sont sur un pic haut et parfois arrivent après un espace vide qui crée une dent dans la ligne du bas du spectre.

Quand tout est synchronisé, les syllabes tombent directement sur les temps comme ci-dessous.

Image de temps Image de temps

Bien sûr il existe des exceptions à ce concept. Cependant, si vous reconnaissez les structures de temps, vous pourrez plus facilement placer les syllabes au bon endroit afin de créer time rapidement et précisément.

Temps de début et de fin des lignes

D’habitude le début d’une ligne est aussi sur un temps. Cependant, le fin n’est pas toujours aussi claire. Parfois il est aussi très difficile d’entendre car la voix se fait plus faible. En général, on peut synchroniser jusqu’au prochain temps comme ceci :

End time End time

C’est quoi le temps ?

Si vous synchronisez à la fois le début et la fin précisément, la plupart des chansons auront un petit blanc de 1 ou 2 temps entre les lignes.

Sons s, f et h

Certaines consonnes affichent un “nuage de son” sur le spectre où il y a normalement juste une fraction voire rien qui ne soit bon à être inclus dans la synchronisation de la syllabe.

Cela peut être souvent observé sur les sons s (aussi z, x et c dans la plupart des langues) et un peu omins prononcé sur les sons f et h.

s sound1 s sound1

La structure entre 27.0 et 27.1 ici est un tel nuage de son appartenant au son s (shi dans ce cas précis.)

s sound2 s sound2

Sur la synchro de ce flux audio, on peut voir que la majorité de ce nuage de son est parlé avant le temps et c’est ainsi que la syllabe commence.

La proportion de nuages de sons sur un temps varie approximativement de moitié à rien du tout. Il est très rare de voir plus de la moitié d’un nuage de son appartement réellement à la syllabe après le temps.

Plus rapidement ou lentement

En général, plus la chanson est rapide plus on voit le nuage sonore appartenant à une syllabe. Pour les chansons très lentes, le nuage sonore tend plutôt vers l’extérieur de la syllabe et pour les chansons rapides, vers la moitié.

h sound1 h sound1

L’image ci-dessus montre un nuage sonore h entre 49.8 et 49.9. Il est très similaire au nuage sonore s mais est souvent plus petit. Sur cet exemple en particulier on peut aussi voir une sorte de microstructure à l’intérieur du nuage sonore qui nous montre où est le temps. Pour y voir plus clair sur les différents motifs, regardez la version synchronisée ci-dessous :

h sound2 h sound2

Les sons en f ont souvent un nuage sonore moins intense comparé au temps. Ici on peut voir un nuage sonore f à 30.7.

f sound f sound

Sons h et f

Notez que les sons f et h n’ont généralement (genre 50% du temps) pas de nuage sonore, alors que les sons en s en ont presque toujours un.

Sons st et sp et avoisinants

Chaque fois que vous avez un son en st ou sp, la synchronisation est meilleure si vous excluez complètement le nuage sonore s de la syllabe car il y a souvent un blanc plus large entre les sons s et t (et les autres consonnes qui suivent). Synchronisez la syllabe au son t.

Ici on peut voir un exemple sur le mot strange, où le nuage sonore s entre 22.0 et 22.1 appartient plutôt à la syllabe précédente (c’est un nuage sonore s fusionné ici entre le s de “is” (21.9 à 22.0) et le s de strange).

st sound st sound

Si ces sons arrivent au début d’une ligne, ça peut faire sens de séparer en s-trange si le s au début est appuyé et très long.

En général on obtient un meilleur résultat en donnant au s à part un effet \kf même si la syllabe est plus courte que 100cs

Si ces sons font partie d’un mot, c’est souvent mieux de séparer la syllabe entre eux comme pour fas-ter ici :

st sound within st sound within

sons m, n et l

Les syllabes qui commencent par m, n ou l n’appraissent souvent uniquement comme ligne de base du spectre et ont une dent ou une autre anomalie structurelle comme vu ici pour indiquer le temps.

n sound1 n sound1 n sound2 n sound2

Je ne trouve pas le début des syllabes n, m et l !

Comme le début des sons m, n et l n’est pas très visible sur le spectre, il est aussi souvent difficile à entendre parce que les sons sont très amoindris.

Dans le doute, synchronisez la syllabe avec la première voyelle et ignorez m, n et l.

Pour les sons l en particulier, le son est à peine audible quand il arrive avant le temps. Dans ce cas, il est recommandé de synchroniser la syllabe sur le temps.

sons y

Les sons y peuvent être pire que n ou m. Il y en a plein qui on un temps régulier au début avec un pic facilement visible, mais vous en recontrerez aussi peut-être qui sont absolument invisibles sur le spectre.

y sound1 y sound1 y sound2 y sound2

Il peut y avoir une “pause” de légère intensité sur le spectre comme sur l’exemple ci-dessus, mais parfois vous ne le verrez pas. Les sons en y peuvent être l’un des plus difficiles à synchroniser précisément. Malheureusement, ce n’est qu’en déplaçant, écoutént, déplaçant, écoutant etc. de façon répétée que vous obtiendrez l’expérience nécessaire pour obtenir un bon résultat.

Voici un exemple où il n’y a aucune anomalie structurelle visible quand le son y commence :

y sound3 y sound3 y sound4 y sound4

Est-ce que ce son peut aussi être représenté par une autre lettre ?

Dans certaines langues ce son n’est pas écrit avec un y mais un j. Pour clarifier : on parle du son y en anglais comme dans you.

Syllabes commençant par une voyelle.

Le début des syllabes qui commencent avec une voyelle sont souvent difficilement visibles sur le spectre.

Voici un exemple de ho‑u, où les syllabes sont clairement séparées quand on écoute mais pas visuellement.

Dans ce cas, vous n’avez plus qu’à écouter, déplacer, écouter, déplacer etc. jusqu’à ce que vous soyez content du résultat. Il y a souvent quelques indices pour trouver la séparation sur le spectre mais ce n’est pas toujours évident.

ou1 ou1 ou2 ou2

Voici un second exemple où le début de und n’est pas vraiment visible.

und1 und1 und2 und2

Les sons k et t sounds et tout le reste

Les sons k et t sont des exemples parfaits de bonne visibilité et de syllabe synchronisée où tout ce qui appartient au son est aussi sur la syllabe.

Ces sons apparaissent souvent avec un pic de prononciation qui marque le début de la syllabe.

t sound t sound

Toutes les auters syllabes qui ne produisent pas de nuage sonore sont souvent quelque part entre k et t, contrairment aux sons m, n et l.

La plupart tendent plus vers le côté k et t, heureusement.

Pauses

Il est difficile de strictement et universellement définir quand faire synchroniser une pause. En général c’est uniquement obligatoire quand on utilise l’effet \kf sur la syllabe avant la pause.

Si vous faites ainsi, il y a deux cas où les pauses sont nécessaires. Le premier cas est quand la respiration de l’artiste est audible et quand il n’y a pas de chant à ce moment là.

pause breath pause breath

Sur l’image ci-dessus vous pouvez voir une respiration audible entre 7.5 et 7.7 (de 7.7 à 8.0 il n’y a pas de chant). Cela requiert une pause.

Le second cas est la durée de la pause. En règle générale : si la pause dure au moins un temps, synchronisez-là. Pour les chansons lentes ou moyennement rapide, même un demi-temps est recommandé.

Il peut y avoir une pause en plein mot ?

Même si la plupart des pauses sont entre les mots, sur certaines chansons vous trouverez aussi des pauses dans les mots. C’est un peu contre-intuitif mais ne vous inquiêtez pas. Si l’artiste fait une pause entre deux syllabes d’un mot, c’est ainsi. Synchronisez la pause comme telle car l’audio est votre juge absolu pour la synchronisation et aucune règle ne peut être plus correcte que ça.

Quand dois-je couper des lignes à cause d’une pause ?

En règle générale, couper une ligne quand la pause est plus longue que 50cs fonctionne bien. Des pauses plus courtes sont souvent entre 15 et 30cs.

Ces pauses peuvent être assez communes et devenir de bons points de coupe de lignes qui prennent trop de place à l’écran.

Si elles sont sur une seule ligne, on peut généralement les garder ensemble.

Chants de fond et chants interposés

En particulier au début, il peut être très difficile de timer les voix en fond qui ne sont pas bien visibles dans le spectre. C’est aussi vrai lorsque plusieurs chanteurs chantent des paroles différentes. Dans ce cas, il est indispensable de timer une ligne vocale audible comme celle du premier plan. Cependant, si vous n’entendez pas bien les voix de l’arrière-plan ou du deuxième chanteur, il vaut mieux ne pas les timer plutôt que de les avoir mal placées. Néanmoins, le nombre de voix de fond que vous pouvez entendre et la précision avec laquelle vous pouvez les times s’améliorent avec le temps et la pratique.

Il y a aussi des « paroles » qui sont généralement considérées comme des paroles de fond et qui ne sont souvent pas incluses dans les paroles (officielles) que vous trouvez en ligne, comme oh, ah, uh, etc. En général, il est intéressant de les avoir dans les sous-titres du karaoké s’il n’y a pas d’autres paroles chantées à ce moment-là. Mais cela dépend des goûts de chacun quant à leur inclusion ou non.

Copier le chant de fond ?

Dans de nombreuses chansons, les voix de fond comme oh, oh oh sont très similaires en termes de timing. Par conséquent, il peut être très utile de copier les paroles timées dans d’autres lignes et de les adapter au lieu de les timer à partir de zéro pour chaque ligne.

Si vous avez deux lignes chantées qui se chevauchent, timez le chevauchement exactement comme il est (à défaut au plus proche). Il peut être difficile de les styliser de manière à ce que tout tienne sur l’écran, mais il vaut mieux les timer tels quels plutôt que pas du tout.

Voyelles répétées artistiquement

Dans certaines chansons, vous trouverez des mots avec des voyelles répétées artistiquement, comme dans Star Man de David Bowie. Certains karaokés utilisent un tilde (~), mais il existe une meilleure option qui indique plus précisément au chanteur ce à quoi il doit s’attendre :

Si la répétition porte sur le i de light, on peut imaginer ceci : li-i-ight

ass ass

Bien sûr c’est facultatif, mais fortement recommandé pour le chanteur.

Texte parlé

Pour préciser : Il ne s’agit pas de rap ! Nous parlons de texte vraiment parlé. Par exemple, parfois il a des dialogues au début ou au milieu de d’une chanson.

Si souhaité, il peut être inclus mais pas timé. Juste synchroniser les lignes une par une (pas de chevauchement entre elles) et bien s’assurer que le texte soit en bas de l’écran afin de ne pas les confondre avec du chant.

Vous obtiendrez un bon résultat si vous adaptez le style de manière à ce que les couleurs primaires et secondaires soient toutes deux blanches. De cette manière, il est toujours possible d’appliquer le template karaoke sans provoquer de changement de couleur sur le texte parlé.

Particularités linguistiques

Chaque langue possède ses propres caractéristiques en matière de sons et de syllabes, cela est peut être utile de les connaître pour faire le time . Certaines langues seront abordées ici. Pour les règles plus générales, veuillez vous référer à Réaliser le karaoké et à tout ce qui a été discuté ci-dessus.

Japanese

La langue japonaise possède un ensemble limité et strictement défini de syllabes qui dicte où séparer les syllabes pour le timing karaoké. Ici un aperçu des syllables japonaises et quelques règles sur leur utilisation en k‑timing:

ass ass

  • La plupart du temps, 1 syllabe correspond à 1 kana (voir le tableau ci-dessus). Les exceptions sont les syllabes composées avec des petits や、ゆ、よ (ya, yu, yo) comme rya りゃ ou hyo ひょ affichés sur le côté droit du tableau.

  • Il existe un cas où la transcription en romaji peut induire en erreur : il s’agit de n ん suivi d’une voyelle “ya, yu, yo” qui, en théorie, pourrait également être l’une des syllabes n (na, ni, nu, ne, no) ou des syllabes composées avec elles. Il est courant d’avoir dans ce cas une apostrophe séparant n et la voyelle. Si elle est absente de la transcription, il est fortement recommandé de l’ajouter. Les apparitions les plus courantes de ce cas sont ren’ai et kon’ya.

  • Pour les consonnes doubles (par exemple somatta), il y a 2 options possibles en fonction de ce qu’on entend : soit on coupe so|ma|t|ta si on entend le a deux fois so-ma-a-ta. Ou, si le a est prononcé une seule fois, on coupe comme ceci so|mat|ta (et pas “so|ma|tta”).

2 syllables en 1

Dans tous les cas, on ne doit jamais avoir deux sons distincts timés dans une syllabe si cela est évitable. Par exemple, si la chanson est chantée comme « so-ma-a-ta » mais que nous la coupons comme ceci so | mat | ta, nous aurons « -ma-a- » sur le timing pour mat et nous perdrons le repère visuel pour une syllabe entière. Il faut absolument éviter ce genre d’erreur.

  • S’il y a une pause à l’intérieur de la double consonne comme zut - pause - to la pause est représenté par le premier t de zutto. Dans ce cas, on sépare zut | to et on time la pause sur la première syllabe. Exemple ici :

t pause t pause

  • Un cas étonnant peut exister quand une pause (comme l’exemple au-dessus) devient très longue. En règle générale : les pauses qui font 1,5 fois la taille de la première syllabe doit être timé et considéré comme une vraie pause.

  • Certains kana peuvent être difficile à distinguer des autres. En cas de doute, il est préférable de les laisser ensemble. Par exemple, selon la charte des hiragana, shin doit être couper comme ceci shi | n mais s’il est chanté shin, il n’y a qu’une seule syllabe dans notre timing. D’autres exemples courants sont tous les types de voyelles doubles comme “ii”, “au” et les sons “o” longs se terminant par “ou”.

  • Les syllabes telles que “tsu”, “chi” ou celles commençant par k et t peuvent également avoir des nuances sonores. Celles-ci sont cependant presque toujours inclus dans la syllabe.

tsu1 tsu1 tsu2 tsu2

  • Il arrive parfois que seul la partie consonne est audible dans une syllabe. C’est souvent le cas pour shi > sh, tsu > ts les syllables commençant par k. Dans ce cas, il y a 2 options : soit le rendre visible dans les paroles et ne pas les séparer comme nats’ | ka | shi | i ou sinon, plus communément séparer régulièrement et timer la nuance sonore comme une syllabe entière (na | tsu | ka | shi | i).

ts ts

Corréen

Le système d’écriture corréen a comme le Japonais des syllabes bien définies. Des connaissances de base sur ce système d’écriture sont utiles pour comprendre les séparations de syllabes.

Les caractères Corréens sont appellés hangul (ou hanguel) et ressemblent à ceci :

Hangul Hangul

Les syllabes sont formées en combinant : consonne + voyelle + (optionel) 1-2 consonnes.

Les syllabes ressemblent à ceci (c - consonne, v - voyelle) :

Hangul Composition Hangul Composition

Il faut toujours commencer une syllabe corréenne avec une consonne. Cependant, si ça commence par ng, le son est silencieux. Les syllabes commençant par ng commencent en fait avec une voyelle.

Le début d’une syllabe peut aussi contenir une double-consonne. Ces syllabes sont : kk, tt, pp, ss et jj.

Aussi, il y a une règle qui dit que la consonne à la fin d’une syllabe est prononcée avec la syllabe suivante s’il n’y a pas de consonne au début de la syllabe suivante. Donc si deux voyelles sont séparées par uen consonne, la consonne appartient à la syllabe suivante.

Voici un exemple pour la séparation de syllabes en Corréen :

Korean syllable separation Korean syllable separation

Avec ces informations en tête, il y a des cas où les syllabes sont simples en Hangul mais pas en romanisation. Cela peut arriver avec deux voyelles qui se suivent. Mais la plupart du temps c’est une combinaison avec la consonne “ng” qu’on trouve.

Les cas difficiles sont ng-(voyelle) et ngg-(voyelle). Voici un exemple simple pour voir à quoi le Hangul ressemble dans ce cas, pour que vous puissiez vérifier les paroles en Corréen. Il est fortement recommandé d’indiquer la séparation de ces cas un peu ambigus avec une apostrophe dans la transcription pour aider le chanteur durant le karaoké.

  • anga peut devenir an-ga 안가 ou ang-a 앙아

  • angga peut devenir soit an-gga 안까 ou ang-ga 앙가

n’g n’g

Puis-je entendre la différence ?

Même s’il est possible d’entendre la différence, on recommande fortement de vérifier dans les paroles en hangul car c’est difficile de bien entendre pour quelqu’un qui n’a pas l’habitude du Corréen.

Il y a d’autres points importants pour la langue Corréenne en karaoké.

  • Les syllabes assez communes comme neun ou neul sont parfois difficilement audibles. Faites de votre mieux.

  • Ne séparez PAS les doubles consonnes en Corréen. Elles vont ensemble car elles ne forment qu’un seul son. Ne pas confondre avec le Japonais.

  • s au début d’une syllabe est souvent transcrit en sh puisqu’il est aussi prononcé comme ça. Faites attention à ne pas confondre avec s-h. Si vous l’identifiez facilement en regardant le nuage sonore de s/sh. Dans le doute, vérifiez les paroles en hangul.

Korean sh Korean sh

  • Le Corréen ch et j produisent un nuage sonore. Selon la syllabe, exclure tout ou la moitié du nuage sonore de la syllabe est recommandé.

Korean ch Korean ch

Anglais

L’anglais n’a pas de syllabes strictement définies qui vous laissent un peu de liberté pour leur séparation. Cette liberté empêche parfois de savoir comment bien les séparer. Un dictionnaire avec les syllabes écrites en transcription phonétique comme sur dictionary.com aide bien.

Pour un mot assez confusant comme everyone, vous aurez par exemple :

Everyone syllable separation Everyone syllable separation

Le second e du mot n’est pas dit explicitement, vous devrez donc décider quand le mettre et les deux options sont valides.

Par exemple eve-ry-one.

Vous pourrez aussi tomber sur une chanson avec une prononciation plus unique qui n’est pas montrée dans le dictionnaire mais sonne un peu comme e-ve-ry-one.

Dans ce cas, séparez les syllabes comme vous pensez être le mieux.

Voici d’autres points à garder en tête quand on time une chanson en Anglais :

  • Les sons th ont un nuage sonore similaire aux sons h et devraient être gérés de la même façon.

th1 th1 th2 th2

  • Il peut être contre-intuitif au début de séparer les contractions comme didn’t en deux syllabes, mais en fait c’est en accord avec dictionary.com et dans al plupart des cas ça coincide avec les beats de la chanson. Certaines contractions sont aussi en une syllabe, comme don’t.

didn’t on dictionary.com didn’t on dictionary.com didn’t timed didn’t timed

  • Les sons t peuvent produire un grand nuage sonore en Anglais. Il vaut mieux les inclure dans la syllabe comme ici à 0.4

t sound cloud t sound cloud

  • y, surtout dans you, produit souvent un nuage sonore. Dans la plupart des cas, il vaut mieux l’exclure de la syllabe, mais comme le nuage sonore provient d’un son en t ça rend parfois mieux de l’inclure. Faites attention au beat pour prendre cette décision. Voici un exemple avec le nuage sonore de 50.0 à 50.1 exclus :

you you

Français

Un truc très compliqué quand on time des paroles en Français c’est de ne pas avoir les espaces couvrant les syllabes car il n’y a pas beaucoup de contractions en Français.

Vous aurez aussi à décider fréquemment où mettre les lettres qui ne sont pas prononcées.

Les lignes qui commencent par y, mais aussi celles avec et, le ou est peuvent être difficiles à entendre. Par exemple :

French split French split

Il y a des règles strictes en Français pour les séparations de syllabes qui sont à peu près comme ça :

  • Deux voyelles : séparer les voyelles
  • Voyelle - consonne - voyelle : la consonne va sur la seconde syllabe.
  • Voyelle - consonne x2 - voyelle : Une consonne sur la première syllabe, l’autre sur al seconde. Cela s’applie aussi aux doubles consonnes.
  • Si la 2ème consonne dans le cas sus-nommé est r ou l, les consonnes vont dans la deuxième syllabe.

Pour en savoir plsu sur la séparation des syllabes en français, il y a ce guide (en anglais) ici.

D’autres points à noter sur le Français :

  • Les sons ch peuvent aussi produire un nuage sonore qu’il vaut mieux exclure de la syllabe, comme dans cet exemple à 34.1

ch sound ch sound

  • En Français, un espace est placé avant !, ? et : Même si c’est correct, Aegisub va penser que ces marques sont des syllabes, alors faites bien attention à la séparation de syllabes.

  • Le mot rien, assez commun, peut être entendu en deux syllabes. La première est habituellement très courte. Que vous sépariez ça ou non est souvent une question de goût. Ceci dit, on recommande de séparer si possible.

rien rien

  • Comme la consonne du mot précédent est ligaturée à un mot commençant par une voyelle, ne vous laissez pas avoir par ça et séparez bien selon l’espace comme ceci, même si l’avant-dernière syllabe sonne comme so :

ligatures ligatures

  • Pour les contractions comme je > j’, il peut faire sens de timer le nuage sonore de j comme une syllabe séparée. Par exemple :

contraction contraction

Allemand

Comme en Anglais, la séparation des syllabes peut être compliquée en Allemand. Cependant, il y a une séparation officielle des syllabes dans le sens orthographique du terme, documentée dans le duden par exemple, qui peut vous orienter. Cependant, cela peut ne pas convenir au mieux à la chanson.

Vous pouvez voir la partie du site web qui montre la séparation orthographique de la syllabe pour irgendwie ici :

irgendwie irgendwie

L’exception assez commune à ceci sont les mots qui ont ck mais pas à la fin. C’est mieux de séparer c|k comme ici dans Soc|ken.

ck separation ck separation

L’autre exception sont les mots où une voyelle seule est la première syllabe d’un mot car elles ne sont officiellement pas séparées mais pour du karaoké c’est mieux de le faire. Par exemple pour o|der ou ü|ber.

Voici d’autres points à prendre en compte quand on time des paroles en Allemand :

  • Les sons ch ont svouent un nuage sonore qu’il vaut mieux exclure de la syllabe comme pour les sons s

ch sound ch sound

  • v est habituellement dit en f et ne produit pas le même type de nuage sonore.

v sound v sound

  • Les mots se terminant par -en sont assez communèment contractés comme ceci : gehen > geh’n. Ils ne sont pas habituellement marqués dans les paroles. Notez que dans ces cas-là le mot est réduit d’une syllabe. Vous pouvez marquer la contraction pour aider un peu le chanteur mais ce n’est pas obligé.

  • Si vous avez un verbe dans sa forme dictionnaire sans contraction, la dernière syllabe ne se voit pas sur le spectre, comme pour les syllabes m, n ou l.

verbs in German1 verbs in German1 verbs in German12 verbs in German12