在深度学习的数据训练过程中,虽然tensorflow和pytorch都会⾃带打乱数据进⾏训练的⽅法,但是当我们⾃⼰⽣成数据,或者某些情况下依然要⾃⼰⼿动打乱顺序。
这⾥介绍如何以相同规律打乱X,Y两组数据,多组数据相同道理。
第⼀种:(X,Y是list的格式,不是array)
产⽣相同的种⼦(seed)打乱顺序:
import randomseed =50
x_batch, y_batch,start_num = train_load_order_sharp_5_9(image_list, num, start_num,length)#加载我所有的数据,这⾥想x_batch,Y_batch是list的格式,要注意random.seed(seed)
random.shuffle(x_batch)
random.seed(seed)#⼀定得重复在写⼀遍,和上⾯的seed要相同,不然y_batch和x_batch打乱顺序会不⼀样random.shuffle(y_batch)
第⼆种:zip的⽅式,更加⾼效:(同第⼀种,X,Y是list的格式,不是array)
from random import shuffleshuffle_data=Trueif shuffle_data:
c = list(zip(x_batch,y_batch)) shuffle(c)
x_batch,y_batch = zip(*c)
举个例⼦:
>>> a=[1,2,3,4]
>>> b=[11,22,33,44]>>> c=list(zip(a,b))>>> shuffle(c)>>> a,b = zip(*c)>>> a(2, 4, 3, 1)>>> b
(22, 44, 33, 11)
#这⾥就让a,b以相同的规律被打乱
补充:python打乱列表的⽅法解决问题_Python 如何随机打乱列表(List)排序
现在有⼀个list:[1,2,3,4,5,6],我需要把这个list在输出的时候,是以⼀种随机打乱的形式输出。专业点的术语:将⼀个容器中的数据每次随机逐个遍历⼀遍。注意:不是⽣成⼀个随机的list集。环境:Python 3.6
解决⽅案:
⽅案⼀:
有⼈可能会通过Random内置函数,来间接实现想要的结果。但是这种⽅式,太原始,也不够优雅,⽽且有种重复造轮⼦的嫌疑。这⾥我就不贴我⾃⼰通过random实现的效果了。
⽅案⼆:
Random中有⼀个random.shuffle()⽅法提供了完美的解决⽅案。代码如下:
x = [1,2,3,4,5,6]random.shuffle(x)
print(x)
输出结果:
第⼀次输出内容:[6, 5, 1, 3, 2, 4]第⼆次输出内容:[6, 1, 3, 5, 2, 4]第三次输出内容:[5, 3, 1, 2, 4, 6]
从结果我们可以看出,输出是完全随机的,代码量就两⾏,不需要random,不需要for循环。源码解读:
def shuffle(self, x, random=None):
\"\"\"Shuffle list x in place, and return None.
原位打乱列表,不⽣成新的列表。
Optional argument random is a 0-argumentfunction returning a random float in [0.0, 1.0);if it is the default None,
the standard random.random will be used.
可选参数random是⼀个从0到参数的函数,返回[0.0,1.0)中的随机浮点;如果random是缺省值None,则将使⽤标准的random.random()。
\"\"\"
if random is None:
randbelow = self._randbelowfor i in reversed(range(1, len(x))):
# pick an element in x[:i+1] with which to exchange x[i]j = randbelow(i + 1)x[i], x[j] = x[j], x[i]else:_int = int
for i in reversed(range(1, len(x))):
# pick an element in x[:i+1] with which to exchange x[i]j = _int(random() * (i + 1))x[i], x[j] = x[j], x[i]
注意 :
从代码的注释,我们看到random.shuffle()是对原list做修改,如果需要保留原list,请注意这个细节。
以上为个⼈经验,希望能给⼤家⼀个参考,也希望⼤家多多⽀持。如有错误或未考虑完全的地⽅,望不吝赐教。
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- efsc.cn 版权所有 赣ICP备2024042792号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务