Захотел я значит посмотреть, знание каких технологий нужно для будущего специалиста[1]. Конечно нажимать на кнопки - это не подход программиста. Решено было запилить парсер для hh.
После нескольких неудач я нашёл код, который на 99% (как я тогда думал) решает мою задачу: https://office-menu.ru/python/96-api-hh. Всё было крайне просто, найденный код красивый, понятный, родной. Файлики джейсона записывались, ОП уже предвкушал окончание этого маленького приключения с парсером. Но тут гром среди ясного неба[2]: ДАЛЬШЕ ВЫ НЕ ПРОЙДЁТЕ, ПОКА НЕ ВЫУЧИТЕ SQL
Пришлось узнавать, как создавать таблички и манипулировать ими [3].
Наконец поняв, как заставить код работать, был сделан неутешительный вывод: таблички получаются совершенно отвратительные для моих нужд и их придётся заполнять самому.
130 json файлов вот с такими ключами[пик 1], из которых интересны 5, с 2 из которыми проблемы: В desctiption слишком много всего, нужны только требования [2]
В key skills данные - это словарь в словаре, каждый из которых очень хочет собственную ячейку в таблице [3]. Автор кода так и сделал, но в моём случае это не выход, нужно их собрать в одной строчке
Тебе нужно сначала собрать этот самый список кейскилов, а потом уже шерстить по тексту дескрипшна в поиске оных Для работы с csv в удобном табличном формате рекомендую ознакомиться с библиотекой pandas Она же и сможет записать после преобразований твои данные в базу Удачи
> Захотел я значит посмотреть, знание каких технологий нужно для будущего специалиста[1]. Конечно нажимать на кнопки - это не подход программиста. Решено было запилить парсер для hh
Нахуя тебе парсер, если ты в итоге всё равно собираешься смотреть результаты глазами, а не скармливать машине для обучения нейронки, например?
Долбоёб, ты видишь, какой у тебя убогий интерфейс для чтения этой хуйни и сколько усилий ты тратишь на написание "одноразовой" программы, которая тебе больше не понадобится?
И ты ещё пиздишь что-то про фильтрацию? А ничего, что на самóм сайте фильтрация есть по умолчанию, и имя ей — строка поиска?
Ебанько, с таким мировоззрением ты точно далеко не уплывёшь, сажи твоему треду
>>252482085 (OP) Парсер для HH бесполезен, потому что оформление вакансии не соответствует действительности. Там могут искать сеньора с значением в графе опыта работы "Без опыта", коммерческий опыт разработки с графой "Для студентов" и т.д. А потом само содержание вакансии не соответствует действительности. Откликнулся на вакансию разработчика, а на собеседовании спрашивают про администрирование линукса.
Так что откликайся на все вакансии подряд. Позовут на собеседование - круто, не позовут - ну и хуй с ними.
Ещё и комментарии какие-то ебланские, К.О.-петан очевидность, ты ли это?
>>252484330 Внегласноеправило. Погромист из европы не станет учить русский язык, чтобы прочитать твою парашу. + при приёме на работу это очень большой минус.
>>252484455 >Внегласное правило. Т.е. манястадарт. А тем временем в PEP8: >Ensure that your comments are clear and easily understandable to other speakers of the language you are writing in.
>Python coders from non-English speaking countries: please write your comments in English, unless you are 120% sure that the code will never be read by people who don't speak your language.
Первая строка неявным образом говорит, что можно писать не на английском. Вторая говорит прямо, что для всяких хедхантеров можно писать на русском.
>>252484195 >Лучше бы нормальный язык учил, а не эту хуйню
Для того, чтобы выбрать следующий язык я и начал делать парсер, так то
>>252484209 > >Парсер для HH бесполезен, потому что оформление вакансии не соответствует действительности. Там могут искать сеньора с значением в графе опыта работы "Без опыта", коммерческий опыт разработки с графой "Для студентов" и т.д. А потом само содержание вакансии не соответствует действительности. Откликнулся на вакансию разработчика, а на собеседовании спрашивают про администрирование линукса. >Так что откликайся на все вакансии подряд. Позовут на собеседование - круто, не позовут - ну и хуй с ними.
Спасибо за советы. В главной степени начал делать парсер для того, чтобы решить, что дальше учить (пунктуацию питоши +- знаю, а читать доксы библиотек без реальной задачи вроде этой как-то бесполезно звучит).
>>252484588 > Для того, чтобы выбрать следующий язык я и начал делать парсер, так то Еблан? Точно еблан. Это то же самое, как каждый раз перед едой летать с Урала в ДС-1 и обратно.
>>252484701 Я сидел и не знал, что делать дальше, чем заняться, курсы питона меня больше не возбуждают. Пошёл посмотреть на hh, что хотят от молодого погромиста. Смотреть не удобно
Пошёл делать удобный просмотр всех объявлений в одной табличке на базе того, что уже умею.
>>252485079 >Пошёл посмотреть на hh, что хотят от молодого погромиста. Python, Linux, Git, SQL, noSQL. Если это веб, то Django(Или другой фреймворк, aiohttp и Flask тоже популярны), html, css, основы JavaScript, иногда могут Angular к ЖС спросить. Если это админство, то спросят по сетям. Если девопс, то те же сети плюс докер. Если это QA, то про тесты и их технологии, тут универсального набора нет. В бигдате тоже универсального нет, но там, я думаю, разницы между фреймворками не очень.
>>252485267 Ну смотри. Ты пишешь на одном языке программирования, чтобы потом его бросить и начать учить другой. При этом ты потом ещё хуй знает сколько будешь отучать себя от питоновского говнокода.
>>252485471 >Ну смотри. Ты пишешь на одном языке программирования, чтобы потом его бросить и начать учить другой. При этом ты потом ещё хуй знает сколько будешь отучать себя от питоновского говнокода. За неделю с джанго на спринг пересел.
>>252485528 Если ты не начинающий - да, это легко. А вот наш ОП, ВНЕЗАПНО увидев код на каком-нибудь C++, моментально ахуеет от синтаксиса и соснёт хуйца.
Еблан, кто так ЯП учит? Устраивайся куда-нибудь и по мере работы всему нужному научишься. Ты сейчас занимаешься таким же дебилизмом, как и изучением иностранных языков
>>252485379 >Linux Что под этим обычно подразумевают? и любой ли linux Никогда не пробовал linux, но если бы увидел в требованиях: "Навыки работы с Windows 10", То был в некотором замешательстве
>>252485900 Меня взяли, но не на прямую. Устроился на стартап саппортом в коллцентре и позже меня сделали разрабом. 4 года спустя там же работаю уже миддл солидный дохуя знаю
>>252482085 (OP) >3 Всегда проигрывал с начала его туториалов по спрингу
"Асалам Алейкум, сегодня я буду учить вас спрингу"
И я что то не понимаю с какого хуя эт от пидор просто открывает quick start на спринге и озвучивает что там написано, не добавляя от себя ничего, попутно напоминая что у него есть курс по 30 бачей. Стоит хоть курс того? Рассказывает вроде норм
Повторюсь с вопросом. Что с key skills можно сделать я представляю.
Но как можно отбросить лишнее в пикрил? Скажем отбрасывать то, что идёт перед определённой фразой (списком фраз) и то, что идёт после. Или с помощью какой-нибудь html разметки.
>>252487282 >Но как можно отбросить лишнее в пикрил? Никак. Тут только машинное обучение поможет. Вакансии не имеют чёткой структуры, обычным методом тут не вытащить требования. Если же ты про конкретно этот случай, то тебе BeatifulSoup нужен.
>>252487282 У hh нет API? Может ты зря вола ебешь и тебе надо просто окажется сделать import requests parametri = {'тут уж дикшинари сам должен написать что тебе надо': 'поросеночек'} vacancia = requests.get('hh.ru/api', parametri=parametri) И потом уже что хочешь делай - в джейсон мутируй, в цсв, в тхт Если апи нет, то конечно это не совет
>>252488140 >А если будет список фраз (там их всего штук 10, едва ли больше) Будет куча ложны результатов и пропусков необходимого. >И писать предложение только после одного из этих слов? >Только как эту операцию в коде написать Регулярные выражения.
>>252482085 (OP) Оп, я учу питон с апреля, но у меня конкретная цель в ДС/машоб, если бы не машоб я бы выбрал ГОвно, выбирать сейчас что-то кроме ГОвна(ну или 1с для рашки) будет только шизик
>>252488624 Везде не ищут без опыта, но у голанга нет такой хуйни как "минимум 6 лет опыта", ему конечно уже лет 12, но так то и молодежному свежему питону уже больше 30
> После нескольких неудач я нашёл код, который на 99% (как я тогда думал) решает мою задачу: https://office-menu.ru/python/96-api-hh. Дальше не читал. Иди нахуй, еблан
>>252488811 Уверен, нихуя сам не умеешь писать. Только все гуглишь и собираешь из говна и палок. В итоге у тебя прога будет работать раз в 50 медленне нормальной, а памяти занимать раз в 10-100 больше положенного
>>252488925 Душнила анальная, оп хоть что-то пытается написать сам, а не в туториал хеле копирует с ютуба бесполезные задачи. Ему и не надо думать о памяти и скорости, главное умение писать код, если его куда-нибудь возьмут - он будет править построчно древний кал, а не билдить архитектуры снуля с реверс-проксями и базами-данных
>>252482085 (OP) Палю годноту. Хочешь быстро вкатится, учи PHP. Хороший язык с 7.* версии. Работы много и вакансий, потому что все считают, что хейтить php модно. Поэтому курсов нет и вкатунов очень мало. Сам так сделал, теперь с хорошей зп сижу и ios изучаю
>>252482562 >Что можно сделать, чтобы элегантно отфильтровать содержимое desctiption и собрать key skills (считай теги на каждой странице) в одну строчку? Нужно найти какой-то паттерн по которому ты будешь вычленять свои скилы. Проблема в том что там может быть написано всё что угодно. Но ты можешь собрать некоторый список того что часто туда пишут. Например взять текст межу словами "требования" и "обязанности". Начало и конец подстроки нормальные люди находят регулярными выражениями, если ты в них можешь то это огромный плюс тебе при приеме на работу.
В целом ты все правильно делаешь. Так и надо изучать программирование - ставить себе задачи и решать их.
>>252482085 (OP) >вкат в петухон >Но тут гром среди ясного неба[2]: ДАЛЬШЕ ВЫ НЕ ПРОЙДЁТЕ, ПОКА НЕ ВЫУЧИТЕ SQL Ну ты и выбрал язык для вката, лол. Дело в том, что петухон везде на вторых ролях. Назови мне хоть одну область, где питон является основным требуемым скилом? - web-development - прекрасно обходятся без петухона, в реальных проектах используется php, java, C#, go, javascript. Петухон используют только школьники для разработки телеграм-бота, серьезные вещи на этом говне не пишут. - machine learning - ВНЕЗАПНО, надо знать машоб, а не петухон. Питон там на уровне a + b = хуй, а вместо него может использоваться R, да хоть жаваскрипт в качестве обертки для тензорфлоу и подобного говна. - десктоп? Мертв. - бекенд? Ну сказал уже, только проекты школьников или когда надо побыстрому накидать апишку, с этим даже фронт-макака с нодой справится. - мобилки? Ну ты понел, сосешь.