Бред

Ответить в тред Ответить в тред
Check this out!
Аноним 07/05/21 Птн 18:23:25 2461000231
изображение.png 3Кб, 353x88
353x88
Двач, работаю с большими данными на питоне.

Такая проблема: у меня берутся пути ко всем файлам в одной папке, загружаются через json.load, после использования я делаю del переменной, которой присваиваю json, затем после 300к чекнутых файлов, скорость проверки последующих очень сильно снижается. Как это исправить?

Аноним 07/05/21 Птн 18:24:56 2461001212
Бамп
07/05/21 Птн 18:27:14 2461002743
>>246100023 (OP)
>работаю с большими данными на питоне
>Двач, Как вывести строку?
Аноним 07/05/21 Птн 18:28:33 2461003644
>>246100274
Как сделать обработку данных быстрее, алёша
07/05/21 Птн 18:29:00 2461003955
07/05/21 Птн 18:29:19 2461004176
Аноним 07/05/21 Птн 18:30:18 2461004747
Бамп
Аноним 07/05/21 Птн 18:30:20 2461004778
16106383045280.png 3Кб, 340x260
340x260
>>246100023 (OP)
>большие данные
>обрабатывает на ssd
>не знает про буфер
Аноним 07/05/21 Птн 18:30:55 2461005199
>>246100477
Я же пишу del data. Или это не удаляет из буфера?
Аноним 07/05/21 Птн 18:31:31 24610055410
Аноним 07/05/21 Птн 18:32:09 24610060211
>>246100519
>не знает как работает контроллер ssd
>продолжает обрабатывать на ssd
Это только хуже делает, лолка. Любая операция модификации = пизда диску и скорости.
Аноним 07/05/21 Птн 18:34:30 24610074612
изображение.png 4Кб, 324x116
324x116
>>246100554
Я думал, что del data достаточно.

Сделал так, скорость стала ещё меньше, лол
Аноним 07/05/21 Птн 18:35:56 24610084713
Аноним 07/05/21 Птн 18:36:22 24610087414
>>246100746
Принт-то убери, э, слыш, етпа
Аноним 07/05/21 Птн 18:37:34 24610096515
>>246100874
Так я так чекаю скорость лол, вот ща убрал close скорость выше стала
Аноним 07/05/21 Птн 18:41:42 24610122416
>>246100746
Попробуйте использовать

with open(pfried, 'r') as f:
friends = json.load(f)

Вроде при использовании этой шняги закрывать и удалять файл не нужно
Аноним 07/05/21 Птн 18:43:59 24610137317
>>246101224
Скорость поменьше чем обычно
Аноним 07/05/21 Птн 18:44:33 24610141218
>>246101224
Но тут как и с остальными: после 20к обработанных файлов скорость начинает пиздецки падать
Аноним 07/05/21 Птн 18:44:59 24610144519
Получается, что память нагружается. Может быть ещё откуда-то нужно что-то удалить, но я не шарю
Аноним 07/05/21 Птн 18:48:02 24610164120
>>246101412
Ну попробуй интерпретатор PyPy поставить. Вроде в ~26 раз быстрее код исполняет
Аноним 07/05/21 Птн 18:49:00 24610170921
А чё, в питонах профайлеров нет?
мимонуб
Аноним 07/05/21 Птн 18:50:51 24610181722
>>246101412
Потому что быстрый slc кеш записи диска переполняется и ssd начинает писать напрямую в tlc. Ты ничего с этим не поделаешь.
Аноним 07/05/21 Птн 18:57:08 24610218423
>>246100023 (OP)
1. print - дорогая операция. У тебя, может, терминал тормозит, лол.
2. del не нужен.
3. сделай list и записывай туда собранные значения. Потом выведешь.
4. А кто дескрипторы закрывать будет? Сделай как все нормальные люди через with

with open(filename, 'r') as f:
friends = json.loads(f.read())
Аноним 07/05/21 Птн 18:59:02 24610229224
Так ты >>246101817
А разве речь не про чтение?
Аноним 07/05/21 Птн 19:00:24 24610236725
>>246102184
Принт мне нужен в данном случае только для проверки скорости
Аноним 07/05/21 Птн 19:01:04 24610241026
>>246100023 (OP)
ты ебобо? большие данные обрабатываются через спарк
Аноним 07/05/21 Птн 19:05:13 24610266727
>>246102367
time python3 script.py

И не еби мозг.
Аноним 07/05/21 Птн 19:05:28 24610268228
>>246102292
Да, но открытие дескриптора - тоже запись? Попробуй создать легионы пустых, как жизнь дединсайдов и битордов, файлов и прочитать их. Вангую, после 20к тоже будет ПАДЕНИЕ ПОКАЗАТЕЛЕЙ
Аноним 07/05/21 Птн 19:09:06 24610288929
>>246102682

На диск ничего не пишется при открытии файла на чтение, не гони. Только last access в fs обновляется, но нам на этот уровень похуй.
Тут он просто забыл вообще закрывать файлы, от чего и тормоза.
Аноним 07/05/21 Птн 19:11:44 24610306630
16096488353460.jpg 48Кб, 537x240
537x240
>>246102889
>диск ничего не пишется при открытии файла
Точно. Совсем забыл про торсионное хранилище файловых дескрипторов.
Аноним 07/05/21 Птн 19:11:47 24610307031
изображение.png 4Кб, 569x87
569x87
Аноним 07/05/21 Птн 19:12:30 24610311332
Аноним 07/05/21 Птн 19:13:34 24610319033
КОРОЧЕ, ВНЕЗАПНО ВЫЯСНИЛОСЬ, ЧТО ПОСЛЕ 20к ФАЙЛЫ ВЕСЯТ ГОРАЗДО БОЛЬШЕ, ПОЭТОМУ И ОБРАБОТКА ТАКАЯ МЕДЛЕННАЯ
Аноним 07/05/21 Птн 19:13:40 24610320434
Аноним 07/05/21 Птн 19:14:07 24610322835
JD-CafiHa4k.jpg 30Кб, 623x415
623x415
Аноним 07/05/21 Птн 19:14:09 24610323136
Аноним 07/05/21 Птн 19:14:11 24610323537
Стикер 0Кб, 512x512
512x512
Аноним 07/05/21 Птн 19:14:39 24610326538
16143404740257.gif 4037Кб, 498x498
498x498
16033724076030.jpg 41Кб, 640x573
640x573
15719498032880.png 416Кб, 984x918
984x918
15815916868220.png 313Кб, 480x480
480x480
Аноним 07/05/21 Птн 19:15:13 24610330639
>>246103190

Это не отменяет того, что твой код говно.
Ну и так, на будущее - то, что ты простенько обрабатываешь до хуя файлов, ещё не делает это "большими данными"
Аноним 07/05/21 Птн 19:16:01 24610336240
Аноним 07/05/21 Птн 19:16:20 24610338241
>>246102682
Ну пусть попробует тогда открытие и обработку файла в отдельном дочернем процессе. Должно помочь. Если все гут, то можно будет не по одному, а пакетами засылать в отдельные процессы.
Аноним 07/05/21 Птн 19:17:39 24610346642
>>246103382
Та ни, файловый дескриптор сидит в оперативке, а не в фс. В таблицу инедексов пишется интегер -> почти нихуя.
Аноним 07/05/21 Птн 19:20:29 24610363743
>>246103066

Файловый дескриптор никогда не писался на диск, даже во времена доса и 8 дюймовых дискет.
Аноним 07/05/21 Птн 19:20:44 24610365544
>>246103466
Ну так по завершению подпроцесса вся оперативка выделенная под него освободиться. Шо куча, шо стек.
Да похуй, у него просто файлы в хвосте больше весят.
Аноним 07/05/21 Птн 19:24:07 24610387445
1572529588image.jpg 4Кб, 134x240
134x240
Аноним 07/05/21 Птн 19:25:54 24610397946
Аноним 07/05/21 Птн 19:27:56 24610411747
>>246100023 (OP)
>я делаю del переменной
ебать ты черт
Аноним 07/05/21 Птн 19:32:51 24610447448
Аноним 07/05/21 Птн 19:39:22 24610495649
>>246100395
А в качестве буфера жесткий диск на 5400. В НИИ так делают.
Аноним 07/05/21 Птн 19:39:52 24610499750
07/05/21 Птн 19:46:17 24610543451
ИДИТЕ НАХУЙ В СВОЙ РАЗДЕЛ ЕБАНЫЕ БОТАНИКИ И НЕ ПОНТУЙТЕСЬ ТУТ СВОИМИ ЗНАНИЯМИ БОТАНСКИМИ
Аноним 07/05/21 Птн 19:48:27 24610557752
16096861630700.png 373Кб, 666x666
666x666
>>246105434
Записал тебе ссылку на void тебе в inode.
Аноним 07/05/21 Птн 19:58:23 24610621253
И как следует написать мой код, кроме with as?
Аноним 07/05/21 Птн 19:58:56 24610623654
triangleface.png 411Кб, 494x569
494x569
Аноним 07/05/21 Птн 19:59:20 24610625955
Аноним 07/05/21 Птн 20:00:28 24610632356
>>246106212

Тебе не надо писать этот код, потому что этот код не имеет смысла.
Аноним 07/05/21 Птн 20:01:17 24610637857
>>246100023 (OP)
Хуя чмо блядь тупое. после каких курсов, дегенерат блядь? Надеюсь тебя уволят нахуй.
Аноним 07/05/21 Птн 20:03:49 24610654458
Аноним 07/05/21 Птн 20:04:07 24610656459
>>246106378
Я не проходил никакие курсы. Основное, что я делаю -- пишу парсеры и обрабатываю данные
Аноним 07/05/21 Птн 20:07:46 24610678860
>>246106564

Тогда с чего такие тупые вопросы тогда?
Аноним 07/05/21 Птн 20:10:10 24610695561
>>246106788
ну я их обрабатываю по типу скрина вот решил узнать в чём трабла со скоростью, потом выяснилось что есть и другие темы которые нужно пофиксить, всё
Аноним 07/05/21 Птн 20:12:37 24610709562
>>246106955
А хули ты пуанкаре не доказал? А??? погромист по хуям специалист.
Аноним 07/05/21 Птн 20:14:27 24610720963
>>246100023 (OP)
Твои ссанные спаршенные списки друзей не большие данные, дебил
Аноним 07/05/21 Птн 20:17:42 24610742864
>>246107209
А у тебя вообще друзей нет, Хааа, ЛОХ
Аноним 07/05/21 Птн 20:19:03 24610753165
>>246107428
друзьяблядь не человек.
Аноним 07/05/21 Птн 21:02:44 24611065566
БАМП
Аноним 07/05/21 Птн 21:08:38 24611109067
>>246110655
В иноду тебе бампнул, проверяй.
Аноним 07/05/21 Птн 21:10:53 24611125968
БОМП
Аноним 07/05/21 Птн 21:11:41 24611131369
БАМП
Аноним 07/05/21 Птн 21:16:49 24611164870
БИМП
07/05/21 Птн 21:25:10 24611221571
>>246100023 (OP)
Зачем тебе питухон, когда достаточно было обойтись башем?
find friends/ -name '*.json' | xargs -n1 -P10 jq length
Аноним 07/05/21 Птн 21:26:02 24611227172
>>246112215
>риииииииии на пердле быстрее
07/05/21 Птн 21:30:08 24611256173
>>246112271
Причем тут перл, шизоид? Но в общем-то, да. На чем угодно было бы быстрее, даже на перле
Аноним 07/05/21 Птн 21:33:03 24611277174
>>246112561
>рииииииииии говнострочник на баше != пёрдл, шизоид
07/05/21 Птн 21:36:51 24611302975
Настройки X
Ответить в тред X
15000
Макс объем: 20Mб, макс кол-во файлов: 4
Кликни/брось файл/ctrl-v
X
Ваш шидевор X
Стикеры X
Избранное / Топ тредов