2 posts tagged with "vcs"

Git工程实践

December 26, 2020 · 3 min read

在2015年12月8号的时候，注册了github。正是通过github接触了git，那时对于我而言，只是觉得从一个svn工具切换到另外一个git工具，使用上并无太大的差别。后期使用的过程中踩过一些坑，通过官方的教程，学习了git内部的原理，通过做实验慢慢的加深了对git的理解。这里将一些经验上的总结、实践分享出来，希望能够帮助各位在git的学习之路上少走些弯路。

主要特性#

基于快照的版本管理

本地搭建实验环境，新建一个空的文件夹test，在该目录下初始化空的git项目。
```
mkdir test; cd test; git init
```
新建h.txt，将hello world写入到h.txt中
```
echo 'hello world' >> h.txt
```

添加文件并提交代码

git add .; git commit -m 'feat: add h.txt'

追加hello world到h.txt中
```
echo 'hello world' >> h.txt
```
提交代码
```
git commit -am 'feat: modify h.txt'
```

查看文件h.txt的提交记录

git log --pretty=oneline h.tx# 日志展示的内容如下：# 7fa1b21d9b0defe1c2feb8be7bfc3e662bcc31a9 (HEAD -> master) feat: modify h.txt# aa56da444f61cec3a80e231c8b9d66cd75dd8f2b feat: add h.txt

查看h.txt第二次提交的文件内容

git cat-file -p 7fa1b21d9b0defe1c2feb8be7bfc3e662bcc31a9# commit hashgit cat-file -p bb0ae28448e6c19fdbe294df1a518edd92cdf7f8# tree hashgit cat-file -p 10bda51843e912c86901eea164d0b3f7c9a56df3# blob hash# h.txt文件的内容# hello world# hello world

查看h.txt第一次提交的文件内容
```
git cat-file -p aa56da444f61cec3a80e231c8b9d66cd75dd8f2b# commit hashgit cat-file -p 5ee620adb265fa7cb43f76e641da23cec27cd4d9# tree hashgit cat-file -p 3b18e512dba79e4c8300dd08aeb37f8e728b8dad# blob hash# h.txt文件的内容# hello world 
```
通过上述几步的实验操作，可以加深对git快照特性的理解。这里留个任务给各位
新建一个空的git项目，添加一个50M左右的文件并提交，之后在该文件的末尾出新增一行记录并提交。根据git快照的特性，两次提交后，总的大小应该大于等于100M，通过命令du -sh <git项目名>查看该项目总的大小，是否跟你想的一样？如果不是，git是如何处理的。

可离线开发

这是git区别svn的主要特性之一，通过git help列出常用的命令。

These are common Git commands used in various situations:
start a working area (see also: git help tutorial)   clone             Clone a repository into a new directory   init              Create an empty Git repository or reinitialize an existing one
work on the current change (see also: git help everyday)   add               Add file contents to the index   mv                Move or rename a file, a directory, or a symlink   restore           Restore working tree files   rm                Remove files from the working tree and from the index   sparse-checkout   Initialize and modify the sparse-checkout
examine the history and state (see also: git help revisions)   bisect            Use binary search to find the commit that introduced a bug   diff              Show changes between commits, commit and working tree, etc   grep              Print lines matching a pattern   log               Show commit logs   show              Show various types of objects   status            Show the working tree status
grow, mark and tweak your common history   branch            List, create, or delete branches   commit            Record changes to the repository   merge             Join two or more development histories together   rebase            Reapply commits on top of another base tip   reset             Reset current HEAD to the specified state   switch            Switch branches   tag               Create, list, delete or verify a tag object signed with GPG
collaborate (see also: git help workflows)   fetch             Download objects and refs from another repository   pull              Fetch from and integrate with another repository or a local branch   push              Update remote refs along with associated objects
'git help -a' and 'git help -g' list available subcommands and someconcept guides. See 'git help <command>' or 'git help <concept>'to read about a specific subcommand or concept.See 'git help git' for an overview of the system.

上面的命令除了clone、fetch、pull、push，其他的命令都可在本地完成操作。

经验总结#

慎用GitLab中的冲突解决，除非你知道它的命令组合
```
git checkout "source branch"git merge "target branch"
```
只在属于自己的分支中执行rebase，否则只会将提交历史变的更加混乱
慎用revert，除非你知道revert是在原有的基础上做了相反的操作。如果恢复的话，需要执行 revert revert操作

工程实践#

实用工具#

git commit hook 通过hook做一些事前检查，比如检查提交是否符合Angular规范
changelog生成器配合自动化工作流，自动生成changelog
rewrite history 可以用来更改邮箱地址、删除大文件、拆分目录等
draw image 通过绘制图形的方式，可视化的展示了git内部的结构

分支策略#

关于分支模型最理想的模式为trunk based development，实际使用过程中很少有团队能够做到。实践过程中比较好的分支模型：Aoneflow，通过将多个特性分支，合成一个release的方式，实现“准持续集成”

回退流程#

日常开发过程中，有时不小心会污染了Master或者Main分支。此时需要一种方式来回滚代码

gitlab中将Master或Main分支改成非默认分支
删除Master或Main分支
从当前稳定的分支中拉出一个全新的 Master或Main分支
将Master或Main分支设置为默认分支

权限管理#

代码作为软件企业的核心资产，核心的算法及设计方案作为核心中的核心，只允许少部分人有权限查看，这时就需要权限上的管控。git本身提倡的是开放，权限管理不是它的强项，需要借助hook实现。git无法做到目录级别的权限管控，需要将目录拆成单独的项目。gitlab中提供了几类角色(访客、报告者、开发者、管理者)，让我奇怪的是为啥gitlab不实现rbac（如果有的话，应该是个亮点），实际企业内部开发的过程中可能不止这些角色。对于多角色的使用场景，实际操作过程中可以给开发者授予访客的角色，研发负责人授予开发者的角色，运维负责人授予管理者的角色。

评审机制#

基于提交 如果对代码的质量有较高的标准并且团队所有成员都认同该方式，可以考虑引入gerrit
基于分支合并 在合并分支代码的时候，完成代码的审查。一种较宽松的方式，也是我觉得企业内部可推行的方式。

大概在2020年9月份的时候，读到了蒋鑫先生的文章AGit-Flow 阿里巴巴集中式 Git 工作流，蒋先生列的几点特征

仓库的授权模型简单。无需为项目设置复杂的授权，只读用户亦可参与代码贡献。
通过代码评审提升代码质量。参与者不是将代码直接推送的分支上，而是创建代码评审。
仓库的分支模型简单。仓库中没有多余的分支，即不需要创建特性分支。

一方面能够解决了分支策略中多分支的问题，另一方面也解决了权限管理中权限的问题。在git2.29版本已包含蒋先生文章中的proc-receive 。目前阿里云的云效已实现该特性，感兴趣的可以试试。gitlab目前还没有该功能，自己集成的话，蒋先生提供了一些思路。(https://github.com/alibaba/git-repo-go/issues/3)

单体仓库#

CODEOWNERS 通过维护一份 CODEOWNERS文件说明目录空间由哪个团队或个人负责，任何该目录空间下文件的更改，都将由代码的拥有者审核
sparse-checkout 只检出需要的目录，具体可以看这篇文章(https://github.blog/2020-01-17-bring-your-monorepo-down-to-size-with-sparse-checkout/)
git log --pretty=oneline -- <目录名> 查看某一目录下的提交日志
git tag -a <目录名>/vx.x.x -m '<说明内容>' 给目录下的变更打上标签
scalar 提升超大型单体仓库的速度，具体可以看这篇文章(https://devblogs.microsoft.com/devops/introducing-scalar/)
bazel 单体仓库下的构建利器，具体可以看官方的介绍(https://bazel.build/)

数据库脚本版本管理工程实践

September 26, 2020 · 2 min read

Loki

已经好久没写博客了，最近一直在研读leveldb的源码，进展不是很顺利。想要写出一篇自己的见解还要一段时间。正好最近在数据库脚本版本管理控制方面有一些自己的想法与实践，拿出来与各位分享。

需求#

数据库脚本可以用git进行版本管理
数据库脚本可以像普通代码一样纳入code review流程(Gitlab、Gerrit等)进行脚本合规的审查
数据库脚本可以与CI集成，作为pipeline中的一个环节。通过与上一版本进行比较,生成待上线的脚本及对应的回退脚本。

思路#

关于数据库脚本版本管理方面的工具，我在网上也搜了很多工具，比如：flyway、liquibase、uml建模工具等，但是这些工具都不是我想要的。这里简单讲下我的思路：

在代码仓库下创建数据库脚本的仓库进行脚本的维护
每个系统一个文件夹,文件夹下放入系统英文名称.sql的文件(比如订单系统叫oms，则脚本文件的名称为oms.sql)
脚本文件中只放创建表语句，每次脚本的修改，只是对表、列的属性做增删改。

基于以上，实际需要的能够解析DDL中建表语句的工具，通过对比两个版本的DDL生成对应的diff文件。基于这样的诉求，在github上找到了这样的工具，工具的名称叫schemalex

实践#

本地环境创建个文件夹并初始化git仓库

$ mkdir demo$ cd demo$ git init

创建demo.sql文件，初始数据为

CREATE TABLE student ( id INTEGER NOT NULL AUTO_INCREMENT,    PRIMARY KEY (id));

将demo.sql文件保存到本地工作区并打上tag

git add .git commit -m 'add demo.sql'git tag -a v1.0 -m 'add demo.sql'

修改demo.sql，修改后的数据为

CREATE TABLE student (    id INTEGER NOT NULL AUTO_INCREMENT,    name VARCHAR (64) NOT NULL DEFAULT "",    PRIMARY KEY (id));
CREATE TABLE course (    id INTEGER NOT NULL AUTO_INCREMENT,    name VARCHAR (64) NOT NULL DEFAULT "",    PRIMARY KEY (id));

保存文件到本地工作区

git add .git commit -m 'modify demo.sql'

执行脚本./gen.sh /root/demo demo，脚本的第一个参数为数据库脚本文件夹的全路径，第二个参数为数据库脚本名称

#!/bin/bash#set -e
dst_dir=$1sys_name=$2if [ -z "$sys_name" ]; then    echo "usage gen_script.sh dst_dir sys_name"    exit 1fi
script_file=${sys_name}.sql
cur_dir=$(pwd)cd "$dst_dir"
if [ ! -f "$script_file" ]; then    echo "$script_file not be found"    exit 1fi

# test git commandif ! command -v git &> /dev/null; then    echo "git cound not be found"    exit 1fi


if ! git checkout master &> /dev/null; then    echo "checkout master failed"    exit 1fi
current_file=$(mktemp)
if ! cp "$script_file" "$current_file" &> /dev/null; then    echo "copy $script_file $current_file failed"    exit 1fi

# list latest taglatest_tag=$(git describe --tags "$(git rev-list --tags --max-count=1)")
if [ -z "$latest_tag" ]; then    echo "current repo no tag."    exit 1fi
if ! git checkout "$latest_tag" &> /dev/null; then    echo "checkout tags failed"    exit 1fi
tag_file=$(mktemp)if ! cp "$script_file" "$tag_file" &> /dev/null; then    echo "copy $script_file $tag_file failed"    exit 1fi
rollback=$(schemalex "$current_file" "$tag_file" )echo "$rollback" > "$cur_dir"/rollback.sql
diff=$(schemalex "$tag_file" "$current_file" )echo "$diff" > "$cur_dir"/diff.sql

最终会生成两个文件:diff.sql和rollback.sql

diff.sql

BEGIN;
SET FOREIGN_KEY_CHECKS = 0;
CREATE TABLE `course` (`id` INT (11) NOT NULL AUTO_INCREMENT,`name` VARCHAR (64) NOT NULL DEFAULT '',PRIMARY KEY (`id`));
ALTER TABLE `student` ADD COLUMN `name` VARCHAR (64) NOT NULL DEFAULT '' AFTER `id`;
SET FOREIGN_KEY_CHECKS = 1;
COMMIT;

rollback.sql

BEGIN;
SET FOREIGN_KEY_CHECKS = 0;
DROP TABLE `course`;
ALTER TABLE `student` DROP COLUMN `name`;
SET FOREIGN_KEY_CHECKS = 1;
COMMIT;

结语#

虽然schemalex对脚本语句上有一些限制，但是基本满足了我对数据库版本管理的诉求，以上是我在数据库版本管理上的一些实践，供各位参考。

联系方式#

欢迎订阅我的公众号，这里主要会发表些软件工程上的一些想法及实践