用 Python 实现 n-gram 语言模型进行新闻文本内容预测
概述语言模型与新闻的内容预测,分为 4 个阶段:从主流新闻网站科技频道抓取新闻内容;数据预处理;实现 n-gram 语言模型;在测试集上检验模型。
概述语言模型与新闻的内容预测,分为 4 个阶段:从主流新闻网站科技频道抓取新闻内容;数据预处理;实现 n-gram 语言模型;在测试集上检验模型。
格式化字符串漏洞是 PWN 中一定要掌握的一种基本漏洞。它比栈溢出漏洞稍稍复杂一点,需要对函数的调用过程有着更全面的理解,尤其是调用栈的变化情况。格式化字符串的构造需要一定的技巧,本文通过两个简...
本文通过两个基本实例来演示 PWN 中栈溢出漏洞的利用。在开始之前,请准备好需要的工具:Linux 系统(配好 32 位程序运行环境)、Python 2、pwntools、gdb-peda、ID...
本文按照树莓派官方文档推荐的方式——使用 SD 卡烧写工具 Raspberry Pi Imager 为树莓派安装操作系统。同时介绍在没有显示器的情况下开启 SSH 功能。
用 OpenMP、MPI、CUDA 实现蒙特卡洛算法(Monte Carlo method)计算圆周率 $\pi$,并探索算法参数与运算性能以及精度之间的关系。
本文是我对 MIT 6.0002 课程(Introduction to Computational Thinking and Data Science)配套作业 Problem Set 4 的解...
用 Python 求解经典手写数字 MNIST 数据集上的多项逻辑回归问题,以 Softmax 作为损失函数,分别使用梯度下降法和随机梯度法训练模型,并探讨 Mini Batch 对计算结果的影响。未用到任何机器学习框架,完全手动实现。
本文是我对 MIT 6.0002 课程(Introduction to Computational Thinking and Data Science)配套作业 Problem Set 3 的解答。
考虑线性测量 b=Ax+e,利用一范数规范化最小二乘模型,分别使用邻近点梯度下降法、交替方向乘子法、次梯度法从 b 与 A 中恢复 x。此外,讨论 L1 正则化参数对计算结果的影响。
本文是我对 MIT 6.0002 课程(Introduction to Computational Thinking and Data Science)配套作业 Problem Set 2 的解...