redditの円グラフのやつおもろいな トワねねぼたが異様w

雑談

479: ホロ速 2021/01/22(金) 15:12:31.06 ID:okHYtM690
redditの円グラフのやつおもろいな
トワねねぼたが異様w

 

482: ホロ速 2021/01/22(金) 15:18:43.49 ID:iLAgb2WDa

 

489: ホロ速 2021/01/22(金) 15:21:57.01 ID:okHYtM690

>>482
それw

ねねは割と初期から時差の関係か昼雑の時にラテン系の人いるね
ぼたんは露訳切り抜きから待機所も凄い

 

498: ホロ速 2021/01/22(金) 15:26:11.11 ID:LFJz8baJd
>>482
ちょこ先とムキロゼパイセンの英語枠はARKだろうな
あれ海外では未だに人気かなり高いし
ARK内で米中戦争とかやってるし

 

519: ホロ速 2021/01/22(金) 15:35:03.25 ID:6oeoIhi10
>>482
登録者の実数でいえば、フブキところねが一位か
ぼたんも意外な需要とって面白い結果になったな

 

524: ホロ速 2021/01/22(金) 15:40:20.88 ID:K/9uAY6Y0
>>482
向こうもぼたんのロシア人気について語ってんね
「アディダスはあくまで付加的なもので、ロシア人は白髪キャラが大好きでぼたんのゲーム選択もロシア人に完全にマッチしている」

 

527: ホロ速 2021/01/22(金) 15:42:45.00 ID:JvaKeHqaM
>>482
ししろんの13%ロシア語はすげーなw
ねねちも1.3%を拡げてけ

 

591: ホロ速 2021/01/22(金) 16:24:20.60 ID:ECVbPIhs0
>>482
トワはあれから海外ニキの為に頑張ってたしほんと良かったな

 

635: ホロ速 2021/01/22(金) 16:46:35.92 ID:zBhCYI7Y0

>>482
これTOTAL messages per hourって項目がおもしろいな。

同接や配信時間の短さ考えるとスバルとはあちゃまのコメント量凄くないか

 

485: ホロ速 2021/01/22(金) 15:19:14.22 ID:DgBDZKbAa

>>479
これか
トワ様はコメントの50%英語でししろんは13%がロシア語
団長は英語7%のみか

Which member gets the most English chat messages? The fewest? I analyzed ~3 million Youtube chat messages to answer these questions and discover other fun facts. from Hololive

529: ホロ速 2021/01/22(金) 15:44:08.99 ID:9MoOeSyB0
>>485
これTMTが英語カウントされてるだろ

 

574: ホロ速 2021/01/22(金) 16:15:02.75 ID:iLAgb2WDa
>>529
除外されてるよ
Redditポストに手法がかなり詳しく書いてある

 

582: ホロ速 2021/01/22(金) 16:22:56.23 ID:iLAgb2WDa
>>574
追記
このコメントのツリーで詳しく書いてあるけどおもろいわ
ちょっとした論文みたいだ

データ収集についてGoogle翻訳したもの

データ収集方法論

最初に、分析するメッセージをどこで取得するかを正確に決定する必要がありました。このプロジェクトの私の目標は、各メンバーの平均ストリームの言語内訳を取得することでした。独自の1回限りのストリーム、特に特定の言語に焦点を当てたストリームなどのコンテンツによってデータが歪められることは望ましくありませんでした。そのために、分析するストリームを決定するための2つのルールを確立しました。(1)コラボは他のコラボメンバーの視聴者が私が観察していたストリーマーのチャットに大きな影響を与えるリスクがあるため、コラボはありません。(2)言語はありません。 -焦点を絞ったストリーム、言い換えれば、「英語のみ」ではありません。課題、「英語学習」ストリームなどはありません。ルール(2)の効果はごくわずかであり、2つのSoraストリーム、1つのShienストリーム、および1〜2のCocoストリームのみが除外されました(Cocoの詳細については以下を参照)。 。

次に、各メッセージを解析する方法を決定する必要がありました。最初のステップは少し前処理でした。メッセージが数字のみ、絵文字、句読点、「w」のみ、またはこれらの任意の組み合わせである場合、メッセージを完全に破棄し、個々の言語または合計にカウントしませんでした。メッセージの数。このようなメッセージは、個々の言語に正確に割り当てることができませんでした。次に、各メッセージを対応する言語バケットに配置する必要がありました。この画像では、4つのバケットをEN / ID、JP、ES、およびRUと呼んでいますが、使用した解析アルゴリズムのため、100%正確ではありません。各バケットの完全な定義は次のとおりです。

EN / ID –英語のアルファベット(A〜Z)にあるラテン文字のみを使用するメッセージ。これは主に英語とインドネシア語をキャプチャします(どちらも26の標準英語文字のみを使用するため)が、メッセージがたまたま特別な文字を使用しなかった場合、他のラテン語ベースの言語からの英語以外のメッセージを誤ってキャプチャする可能性もあります。これは、ライターが発音区別符号を適切に書くのが面倒だったため、またはその特定のメッセージに発音区別符号が含まれていなかった場合に発生する可能性があります。これの全体的な効果は、EN / IDがごくわずかに過大評価されることですが、Holoメンバーのチャットでアクセントのないスペイン語、フランス語、イタリア語などのメッセージを書く人の数は非常に少ないため、サンプルサイズが非常に大きいはずです。これが引き起こす実際のバイアスをほとんど排除します。

ES –少なくとも1文字が英語以外の文字であるラテン文字を使用して書かれたメッセージ。これは、スペイン語のéやドイツ語のäのような発音区別符号から、スカンジナビアのØのようなまったく新しい文字まで、すべてをカバーしています。このバケットは技術的には多くの異なる言語を網羅していますが、Holoの目的では、ほとんどがスペイン語(およびおそらくポルトガル語)のメッセージであるため、便宜上、バケットを単に「ES」と呼んでいます。

RU –キリル文字を使用して書かれたメッセージ。ロシア語以外にもキリル文字を使用する言語は技術的に多くありますが、キリル文字のメッセージの大部分はロシア語であると言っても過言ではないので、このバケットを「RU」と呼ぶのが妥当だと思います。

JP –前処理で完全に除外されておらず、上記の3つのバケットのいずれにも該当しないメッセージ。日本語の文字数が非常に多いため、何かが日本語のメッセージであるかどうかを判断するために、排他的なアプローチを採用することにしました。これは、技術的には、ラテン文字またはキリル文字を使用して書かれていないメッセージは、JPメッセージとしてカウントされることを意味します。したがって、たとえば、アラビア語、中国語、または韓国語のメッセージは、最終的にJPバケットにカウントされます。 EN / IDバケットと同様に、メッセージのサンプルサイズが非常に大きいのに比べて、これらの言語のメッセージ数は非常に少ないため、この影響はそれほど目立たないはずです。

それがすべて終わったので、最後のステップは、使用する個々のストリームを決定することでした。このため、可能な限り最新のデータを取得できるように、メンバーの最新のストリームを選択しました。以下で説明する2つの特定の例では、メンバーの平均ストリームのより代表的なサンプルを取得するために、古いストリームを優先して、最近のストリームをいくつか放棄することにしました。

データの量に関しては、メンバーごとに最低9つの異なるストリーム(正確な量は他のさまざまな要因に基づいてメンバーによって異なります)、メンバーごとに最低15時間のコンテンツ、および最低50,000のチャットを使用しました。各ホロライブメンバーへのメッセージ。 Holostarsは明らかにチャットメッセージが少ないため、要件が少し緩いものでしたが、それでもメンバーごとに最低9つのストリームを使用しました。

引用元: https://egg.5ch.net/test/read.cgi/streaming/1611271946/

+2

PICK UP!

人気記事!

holosokuをフォローする

あなたにおすすめの記事

Amazon Ranking

DL site

ホロ速

コメント

  1. 会長の英語率がそんな高くないのが意外

    +4
    • 基本日本語配信だからね。最近やってるテラリアなんかはめちゃくちゃ英語喋ってるけど。

      +2
  2. 熱量がすごい

    +2
  3. ぺこらは国勢調査と異なる結果になってるのが面白い
    翻訳待ちの海外ニキが多いのか見てるだけの人が多いのか日本人がぺこらのアンケートに参加しなかったのか

    +5
    • あれはぺこらにとっても意外な結果だし
      アンケートの告知がyoutubeコミュニティにしか上がってなかったので
      気づいていない日本人が多かった

      +5
    • 日本人ってコメントとかアンケート回答しない気質だし

      +4
  4. ぺこらるしあココ辺りは体感的にはもうちょっと海外勢多そうだけどな
    コメント数と海外人気は比例しないんだろうか

    0
    • 母数がでかいからそう見えるだけでは。例えばトワ様のが比率は多いけどぺこらの海外ファンのが圧倒的に多いわけで

      0
  5. 配信中のねねちのテンションはラテン系のそれに近いからブラジルニキ?はシナジー感じてそう

    0
    • ねねちはちょいちょいスペイン語喋るからじゃないの
      あとブラジルはポルトガル語
      ちょいちょいチャット欄にチリ人とかペルー人おるんで別の南アメリカの人だろう

      +8
      • ねねち雑談のとき毎回一生懸命色んな外国語喋ってるからちゃんと結果出てんの嬉しいなぁ

        +8
        • 一生懸命外国語話そうとしてるこ可愛いからね

          +2
  6. こないだスペイン語かなんかで自己紹介動画上げてたVがバズってたからまだまだ開拓できるんやなって感じる
    スーペーねねちになっていけ

    +7
  7. ESってスペインだったりする?

    +1
    • スペイン語やね。español
      ねねちはいつの間にかスペイン語リアタイ翻訳勢が来るようになってた

      +5
      • nene がスペイン語で「赤ん坊、赤ちゃん」の意味らしいと昼雑配信で海外ニキが言ってたわ
        名前から興味持ったパターンかもね
        昼雑頻度高いしあちらの時間帯的にも見やすいんじゃないかな

        +10
        • ぼたんはロシア語でオタクらしいし偶然って凄いなぁ

          +4
  8. ししろぼたん、ロシアのスパイ説。

    +4
  9. IDとENもちょっと見てみたい

    +4
  10. むしろ船長の海外コメント率思ったより高くてびっくりしたわ待機中とスパチャ読みで海外ニキ呼びかけたときぐらいしか見ないのに

    +2
  11. ここまではっきりデータ出てるから最近ちょくちょく
    英語のコメ読みとかショート動画とか出してるんやろうな
    まあ、配信者として見に来てくれた人を楽しませるって至極当たり前のことやけども

    +3
  12. 会長もうちょっと海外ニキ多いイメージだけどなー

    0
  13. あくあの英語コメ率少ないのかなり意外なんだが
    シオンスバルとか雑談多いタイプと同じくらいか

    0
  14. 同接バグで海外ニキがはじかれてるとかじゃないのかな?
    最近海外コメが一気に減ったのと日本からでも普通にコメの反映がおかしい気がするし

    0
  15. コメントはアーカイブで見たとき自分のコメントが配信画面に映ってて横のチャットに無いときなんでやねんって思う

    0
  16. ししろぼたんがS.T.A.L.K.E.RやったらRu爆発的に増えそうやな

    +2
  17. みこちの海外コメの少なさはやはり日本人ですら難しいエリート語の壁か

    +2
  18. すいちゃんは意外やな

    +1
  19. こういうのおもしろいな

    0
タイトルとURLをコピーしました