【python】対応関係を維持したまま２つの配列をシャッフルする方法！

この記事では、２つの配列の対応関係を維持したまま、配列内要素をシャッフルする方法をご紹介していきます。

機械学習の教師データ作成の際に役立つスキルです。

ぜひやり方を覚えておましょう。

なお、今回の記事で用いる基礎的なスキルは以下の記事内でご紹介しています。

pythonにあまり詳しくない人は、こちらからご覧ください。

【python】配列内要素の順番をランダムに並べ替える方法！

前置きはこのくらいにして、本題に入っていきましょう。

事前準備：２つの配列を作成
対応関係を維持した状態で２つの配列をシャッフルする方法
おわりに

事前準備：２つの配列を作成

対応関係を維持した状態で２つの配列をシャッフルする方法をご紹介するうえで、まずは２つの配列がなければ話になりません。

というわけで今回は以下の２つのテキストデータを配列として読み込むことにします。

〇配列１

〇配列２

基本的に配列２は配列１の各要素を１０倍しただけです。

シャッフル後にこれらの対応関係が崩れていないかよく確認してみてください。

対応関係を維持した状態で２つの配列をシャッフルする方法

事前準備がおわったところで、実際のシャッフル作業に移りましょう。

以下がそのサンプルコードです。

import numpy as np
import random
data1=np.loadtxt('data1.txt',np.uint16)
data2=np.loadtxt('data2.txt',np.uint16)
for i in range(100):
    rnd1=random.randint(0,len(data1)) 
    rnd2=random.randint(rnd1,len(data1))
    data1=np.append(data1,data1[rnd1:rnd2],0)
    data1=np.delete(data1,np.s_[rnd1:rnd2],0)
    data2=np.append(data2,data2[rnd1:rnd2],0)
    data2=np.delete(data2,np.s_[rnd1:rnd2],0)
np.savetxt('shuffle1.txt', data1, fmt="%.0f")
np.savetxt('shuffle2.txt', data2, fmt="%.0f")

※配列内にデータがたくさんある場合は、コード中のfor文繰り返し回数を増やしておきましょう。

このコード中でやっていることをざっくり説明すると以下の通りです。

①さきほど紹介した２つの配列を読み込む

②乱数をつかって２つの配列をシャッフル

③シャッフル後の配列をテキストデータとして保存

②の工程で配列１と配列２に対して同じ乱数を使用することで、対応関係を維持した状態でのシャッフルが可能になります。

※先ほどもご紹介しましたが、理屈がよくわからない方は以下の記事をご参考ください。

【python】配列内要素の順番をランダムに並べ替える方法！

いずれにせよ、これで配列がシャッフルできているはずです。

結果を確認してみましょう。

⇒シャッフル後の配列を保存したテキストデータには、以下のデータが出力されていました。

〇シャッフル後の配列１