回忆

记得第一次出去骑车还是在大二的时候,记得是路线从学校去兴平,全程 75 公里,下午四点钟多到的酒店,酒店的那个阿姨人很好,她还允许我把我的自行车带到楼梯间锁起来,短暂休息后就去了杨贵妃墓,在市区里吃了烧烤和鸡蛋醪糟,第二天早早骑车又回了学校。
现在回想起来,当时简直就是无所畏惧,一个人带着手机骑着山地车就出发了🤦‍♂️

多图警告!!!

Read more »

概述

量化是指一种投资交易策略,利用统计学、数学、计算机、人工智能等方法取代传统人工做出决策,通过模型来实现资产交易进而构建投资组合。即利用计算机技术和数学模型来实现投资策略的过程。

主观投资与量化投资的对比:

主观投资 量化投资
基于基金经理的判断 基于模型运算的客观结果
基金经理对宏观环境、行业、公司的研究,预测未来趋势 核心在于利用计算机技术在海量数据中寻找到投资规律
注重研究深度,对少数资产进行深入研究 注重广度,全市场筛选标的,多维度分析
持股集中,稳定性略差 持股分散,组合投资
交易依靠主管认知与判断 模型自主下单
Read more »

简介

Selenium 最初是一个用于网站的自动化测试工具,支持各种 ChromeFirefoxSafari 等主流浏览器,同时也支持 phantomJS 无界面浏览器。不过其更通常的使用在于爬虫中使用,其主要是用于解决 requests 无法直接执行 JavaScript 代码的问题,不过用于解析 Dom 元素更有其妙用之处。

Read more »

简介

NetCat 是一款调试 TCP/UDP 网络连接的利器,被称作是网络调试的瑞士军刀,可见其功能强大。

Read more »

简介

MathJax 是一个 JavaScript 库,可以让你直接用 Latex 语法来写复杂数学公式,使用十分方便。

Read more »

基础

逻辑回归(logistic regression是统计学习中的经典分类方法,虽然被称为回归,但其实是个分类模型。其本质是假设某个数据服从逻辑分布,就可以使用极大似然法估计出其线性回归的参数,之后再使用 Sigmoid 逻辑函数对其分类。
面试的时候千万不要说你很了解 LR,因为细节真的太多了😂

Read more »

小故事

每个人小时候最讨厌的事情就是吃药了,但不幸的是有一天你得了感冒,妈妈给你买了药,你拿到药后打开了包装纸。在药包里有两种药片,一种是白色的另一种是黑色的,白色的看起来比较甜,而黑色的一看就很苦;因此你决定先吃白色的药片,那么如何一把抓住所有的药片呢?你可以找一个勺子这么把药划分出来
svm_1.jpg

那么如果药包里的药片是这样排布的呢?
svm_2.jpg

此时你心里想着终于可以祭出我的绝世神功了!哼哈…充满内力的手一拍桌子,药片就飞到了半空中,此时无影手技能发动,你就用一张纸接住了黑色的药片,哈哈哈哈哈哈…
svm_3.jpg

Read more »

概要

决策树(decision tree)是一种基本的分类和回归方法。其主要呈现为树状结构,在分类问题中,表示基于特征对实例进行分类的过程,可以被认为是 if-then 的规则集合,也可以被认为是定义在特征空间与类空间上的条件概率分布

其优点主要有分类速度快、模型具有可读性,在学习时利用训练数据根据损失函数最小化的原则建立决策树模型;而在预测时对新的数据利用决策树模型进行分类。

决策树模型主要包含以下步骤:

  • 特征选择
  • 决策树的生成
  • 决策树的修剪
Read more »

数据简介

该数据集最初来自糖尿病/消化/肾脏疾病研究所,此数据集的目标是基于数据集中包含的某些身体指标来诊断性的预测患者是否患有糖尿病。
数据集由多个医学指标和一个目标变量 Outcome 组成,医学指标包含患者的怀孕次数、BMI 指数、胰岛素水平、年龄、血压等。

Read more »

简介

Jupyter Notebook 是一个开源的 Web 应用程序,允许用户创建和共享包含代码、方程式、可视化和文本的文档。主要用于 数据清理和转换数值模拟统计建模数据可视化机器学习 等等。
具有以下优势:

  • 可选择语言:支持超过 40 种编程语言,包括 PythonRJuliaScala 等。
  • 分享笔记本:可以使用电子邮件、DropboxGitHubJupyter Notebook Viewer 与他人共享。
  • 交互式输出:代码可以生成丰富的交互式输出,包括 HTML、图像、视频、LaTeX 等等。
  • 大数据整合:通过 PythonRScala 编程语言使用 Apache Spark 等大数据框架工具。支持使用 pandasscikit-learnggplot2TensorFlow 来探索同一份数据。
Read more »