mstdn.social is one of the many independent Mastodon servers you can use to participate in the fediverse.
A general-purpose Mastodon server with a 500 character limit. All languages are welcome.

Administered by:

Server stats:

10K
active users

#data_pipelines

0 posts0 participants0 posts today
Habr<p>Ускорить Pandas в 60 раз: проверяем лайфхаки из интернета на реальном проекте и обкладываемся бенчмарками</p><p>Привет! Если после заголовка вы решили, что это очередная статья в стиле «Топ-10 способов ускорить Pandas», то не торопитесь с выводами. Вместо топов и подборок предлагаю взглянуть на бенчмарки скорости и потребления памяти в зависимости от характеристик датафрейма и убедиться, что часть советов из статей по ускорению могут оказаться даже вредными. Разберём, какой из способов ускорения нужно пробовать в разных ситуациях, как это зависит от размера датафрейма и как ведёт себя в реальном проекте.</p><p><a href="https://habr.com/ru/companies/tochka/articles/899730/" rel="nofollow noopener" translate="no" target="_blank"><span class="invisible">https://</span><span class="ellipsis">habr.com/ru/companies/tochka/a</span><span class="invisible">rticles/899730/</span></a></p><p><a href="https://zhub.link/tags/pandasprofiling" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>pandasprofiling</span></a> <a href="https://zhub.link/tags/pandas" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>pandas</span></a> <a href="https://zhub.link/tags/pandas_multiindex" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>pandas_multiindex</span></a> <a href="https://zhub.link/tags/dataprocessing" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>dataprocessing</span></a> <a href="https://zhub.link/tags/data_pipelines" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>data_pipelines</span></a></p>
Habr<p>Dagster: новый стандарт для ETL в 2025?</p><p>Мы живем в век данных и data-driven подхода. Есть продуктовые компании, где даже минимальные изменения в продукте обязаны пройти A/B-тест перед релизом (который из-за этого может и не состояться). С бумом данных и AI произошел и бум ETL (Extract, Transform, Load) инструментов. Сейчас, в 2024 году, выбор действительно впечатляет, даже если ограничиться только open source-решениями:</p><p><a href="https://habr.com/ru/articles/883700/" rel="nofollow noopener" translate="no" target="_blank"><span class="invisible">https://</span><span class="">habr.com/ru/articles/883700/</span><span class="invisible"></span></a></p><p><a href="https://zhub.link/tags/dagster" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>dagster</span></a> <a href="https://zhub.link/tags/etl" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>etl</span></a> <a href="https://zhub.link/tags/data_pipelines" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>data_pipelines</span></a> <a href="https://zhub.link/tags/%D0%BE%D1%80%D0%BA%D0%B5%D1%81%D1%82%D1%80%D0%B0%D1%86%D0%B8%D1%8F" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>оркестрация</span></a> <a href="https://zhub.link/tags/data_engineering" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>data_engineering</span></a> <a href="https://zhub.link/tags/mlops" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>mlops</span></a> <a href="https://zhub.link/tags/python" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>python</span></a> <a href="https://zhub.link/tags/dataops_engineer" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>dataops_engineer</span></a> <a href="https://zhub.link/tags/big_data" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>big_data</span></a> <a href="https://zhub.link/tags/big_data_analytics" class="mention hashtag" rel="nofollow noopener" target="_blank">#<span>big_data_analytics</span></a></p>