2023-11-23
slurm集群
00

前言

这是一个使用最新版本的slurm(23.02)进行GPU集群部署配置的示例,并进行了初步测试。鉴于slurm官方文档内容的稀缺和不够丰富,使得很多slurm初学者经常在部署这里踩坑。希望本文档能够对他们有所帮助。


2023-11-01
诗词歌赋
00

黄花绿果挂枝头

斜阳固暖冷封喉

牛皮鸭绒不过膝

一点风情九点愁

npyrbn.jpg

2023-05-01
诗词歌赋
00

一万年前的水蒸气

遇冷凝结

幻作密度为1的雪

好像没有感情的博士

做了一场无关痛痒的法事

但笼子里的小白鼠

却欢呼雀跃了一整个下午

2020-01-01
CICD
00

Jenkins pipeline 简介

Jenkins 发展到2.x, 出现了pipeline,实现了真正意义上的 “pipeline as code”,即 完全的代码驱动构建。使用pipeline进行构建的过程跟用dockerfile进行镜像构建非常相似。pipeline是写在Jenkinsfile文件里面的。

以下是一段经典的jenkins pipeline “hello world” 示例:

pipeline { agent { docker 'centos:latest' } stages { stage('build') { steps { sh 'echo helloworld!' } } } }

其中,整个构建是在一个 最新版本的centos docker 镜像中构建,然后就能在输出中看到 “ hello world” 了。输出截图如下:

image.png

2019-09-19
爬虫
00
  1. Splash在爬虫中的应用背景

Python爬虫框架Scrapy,因其语言易懂,配置简单和异步操作等优势,越来越多的受到爬虫爱好者的喜欢。当然本文讲解的内容和原理,也适用于其他语言所写的爬虫。

但是随着爬虫技术的升级,反扒技术也越来越高明。除了验证码以及限制爬取频率外,越来越多网站使用页面动态技术来阻挠爬虫的直接侵袭。动态页面是与静态页面相对应的概念。

静态页面 : 网页的主要(或所有)内容是以文本形式直接嵌入HTML框架中。这种页面,直接wget,然后就能从中获取我们需要的内容。

动态页面 : 只有少部分(往往不是我们需要的)内容是文本形式直接嵌入HTML框架中。其余大部分核心数据是以javascript的形式在页面加载完成以后或由用户的页面操作行为触发,去服务端加载之后,动态渲染到页面上的。这种页面,wget到的页面不会包含后面渲染的数据,用处不大。

虽然采用Hack方式直接debug页面javascript,会有一定概率破解页面关键细节,但是存在以下劣势: