2463308417 发表于 2021-8-26 14:16:41

【2021.08.26】易语言学习打卡-初学post采集

本帖最后由 2463308417 于 2021-8-26 14:18 编辑

2021.08.26星期四   继续打卡

前言:
在昨天上午的网络验证学习完成之后,易语言基础部分算是结束了,然后下午基本上都是在花时间整理基础部分的笔记。
今天终于开始学习新的部分,《易语言POST》!在分享之前有些话想聊聊,看看大家的看法!
我与POST:
经常听说POST这个单词,只是模糊的认为post是做关于网页相关东西。可能很多初学者,学习易语言的最初是因为游戏,而学习的想法和我一样是学习制作出来一款外挂,满足自己心中所想。
而我为什么现在会选择去学习POST而不是自己想要的外挂方面技术呢?其实不是难度系数的问题,我有花时间学习过外挂,也制作出来过可运行的项目(当然不是我一个人独立完成的,这里不多说),

在花时间去用所学习到的外挂技术获取酬劳时,我发现了几个我以前从未真正看清的隐患:
    在我销售的时候我发现了问题所在,这会让自己处于被动的情况,因为所有收入来源于底下代理的销售量,而且前期出单量少的情况下,根本不赚钱,一天只赚二三百的作者大有人在。
    或许有人说那么多作者肯定抓不到我身上,我小打小闹的再加上我就赚一波,然后不做了,搞别的去。
    我先不说是不是能赚到钱,光是这种想法就非常危险,除非你这个人从出生就没接触过过网络,不然想找你的信息太容易了,更别说警察人家各种专业设备找你跟玩一样。


随着学习的东西越多,接触的事情越多,我渐渐明白了为什么很多做大的作者都跑马来西亚那种国外地方去了。而我显然想学他们那样做肯定是不现实的,我志不在此。
虽然自己玩游戏也需要一些辅助功能,但不出售不商业使用的情况下就自娱自乐吧。因此我慢慢学着看淡这些黑色行业,学习一些可正规商用的技术。正当我不知该从何下手的时候,
我发现在我平常所接触的一些需求当中,有非常多繁琐的操作,比如:让你修改一行字里的某个标签从最初的1改成2,但是这行字在整篇文章内有上千行,难道我们要一个个复制吗?
这种工作量大而且繁琐的内容就可以用到POST这种可以代替人力来一键实现的技术。因此我开始正式接触并学习了POST。


POST初接触:
才开始接触POST,发现除了POST能做我想的以外还有更多用处!
POST用处:1.注册机:网站注册机、app注册机2.数据采集:文字、图片、视频、数据分析3.自动化软件/http协议软件开发:自动抢单、自动下注、自动竞猜4.等等...
那么POST到底啥意思呢?我搜了一下百度和听其他视频内讲师的叙述,大致可以理解成POST就是用来逆向分析http/https协议数据请求的,说高大上一点就是《WEB逆向》。
需要纠正的一点:爬虫的东西post也能做,因为爬虫这两年比较流行,所以好多人以为POST就是做爬虫做网页的,我之前也有被误导,在这对我以前杠过的人say sorry(是我眼界狭小,我是狗,我是狗)!


今天学习了POST部分,我是跟着《代号1126》这个视频学习的。视频内post理论知识比较多,不过都非常简单。前面部分学了 采集IP,用到的是 快代理 这个免费代理网站当例子。


大致源码如下:
.版本 2
.支持库 spec
.支持库 iext

.程序集 窗口程序集_窗口1

.子程序 _窗口1_创建完毕



.子程序 _按钮1_被单击
.局部变量 网页返回文本数据, 文本型
.局部变量 IP地址正则, 正则表达式类
.局部变量 地方区域正则, 正则表达式类
.局部变量 端口的正则, 正则表达式类
.局部变量 时间的正则, 正则表达式类
.局部变量 i, 整数型
.局部变量 ip内容, 文本型
.局部变量 索引, 整数型
.局部变量 地方内容, 文本型
.局部变量 端口内容, 文本型
.局部变量 时间内容, 文本型

网页返回文本数据 = 编码_utf8到gb2312 (到文本 (网页_访问_对象 (“https://www.kuaidaili.com/free/”, , , , , , , , , , , , , , , , )))
调试输出 (网页返回文本数据)
IP地址正则.创建 (#ip正则, 网页返回文本数据, , , , )
地方区域正则.创建 (#地址正则, 网页返回文本数据, , , , )
端口的正则.创建 (#端口正则, 网页返回文本数据, , , , )
时间的正则.创建 (#时间正则, 网页返回文本数据, , , , )
.计次循环首 (IP地址正则.取匹配数量 (), i)
    ip内容 = IP地址正则.取子匹配文本 (i, 1, )
    地方内容 = 地方区域正则.取子匹配文本 (i, 1, )
    端口内容 = 端口的正则.取子匹配文本 (i, 1, )
    时间内容 = 时间的正则.取子匹配文本 (i, 1, )
    超级列表框1.插入表项 (, , , , , )
    超级列表框1.置标题 (i - 1, 0, ip内容)
    超级列表框1.置标题 (i - 1, 1, 地方内容)
    超级列表框1.置标题 (i - 1, 2, 端口内容)
    超级列表框1.置标题 (i - 1, 3, 时间内容)
.计次循环尾 ()



运行展示图:








我用了4个常量保存我的正则表达式内容(当然可以用1个匹配出来,只是为了方便理清思路所以我用了4个):

表达式内容是:
ip正则:<td data-title="IP">(\d+\.\d+\.\d+\.\d+)</td> 也可以用其他方法 比如:<td data-title="IP">([\d\.]*?)</td>
地址正则:<td data-title="位置">([\s\S]*?)</td> 我这里用的全匹配,也可以写成只匹配汉字和空白的
端口正则:<td data-title="PORT">(+)</td>
时间正则:<td data-title="最后验证时间">(+-+-+ +:+:+)</td>

PS:上面的正则我都是用的无脑的匹配方法,如果有更简洁效率的方法,大家回复一下,让我学习学习,谢谢~{:2_37:}!





易生情 发表于 2021-8-26 14:52:22

好贴啊。有学习心得。还有学习过程。希望楼主坚持学习

2463308417 发表于 2021-8-26 14:58:21

易生情 发表于 2021-8-26 14:52
好贴啊。有学习心得。还有学习过程。希望楼主坚持学习

好的大佬{:2_27:}

lzq069 发表于 2021-8-29 17:29:48


楼主太厉害了!楼主,我爱你!我觉得易语言吧真是个好地方!

lxgsreyy 发表于 2021-9-15 19:21:13

666楼主太厉害了!楼主

风魔灬剑侠 发表于 2021-10-17 11:39:23


楼主太厉害了!楼主,我爱你!我觉得易语言吧真是个好地方!

治国 发表于 2021-12-10 14:42:16


楼主,我太崇拜你了!我想我是一天也不能离开易语言吧。

q9332282 发表于 2022-4-17 16:04:35

楼主发贴辛苦了,谢谢楼主分享!我觉得易语言吧是注册对了!

阮文轩哥哥 发表于 2023-1-6 18:28:06

居然还做笔记!能做到这一点已经很不错了,加油,继续努力,我感觉你说的话都很对!
页: [1]
查看完整版本: 【2021.08.26】易语言学习打卡-初学post采集