new sampling (on cpu)

GiggleLiu · GiggleLiu · commit 08a1ce42edee · 2023-07-08T00:06:01.000+08:00
diff --git a/Project.toml b/Project.toml
@@ -11,15 +11,18 @@ LinearAlgebra = "37e2e46d-f89d-539d-b4ee-838fcccc9c8e"
 OMEinsum = "ebe7aa44-baf0-506c-a96f-8464559b3922"
 PrecompileTools = "aea7be01-6a6a-4083-8856-8a6e6704d82a"
 Requires = "ae029012-a4dd-5104-9daa-d747884805df"
+StatsBase = "2913bbd2-ae8a-5f71-8c99-4fb6c76f3a91"
 TropicalGEMM = "a4ad3063-64a7-4bad-8738-34ed09bc0236"
 TropicalNumbers = "b3a74e9c-7526-4576-a4eb-79c0d4c32334"
 
 [compat]
+Artifacts = "1"
 CUDA = "4"
 DocStringExtensions = "0.8.6, 0.9"
 OMEinsum = "0.7"
-Requires = "1"
 PrecompileTools = "1"
+Requires = "1"
+StatsBase = "0.34"
 TropicalGEMM = "0.1"
 TropicalNumbers = "0.5.4"
 julia = "1.3"
diff --git a/example/asia/asia.jl b/example/asia/asia.jl
@@ -10,6 +10,9 @@ probability(tnet)
 # Get the marginal probabilities (MAR)
 marginals(tnet) .|> first
 
+# The corresponding variables are
+get_vars(tnet)
+
 # Set the evidence variables "X-ray" (7) to be positive.
 set_evidence!(instance, 7=>0)
 
diff --git a/src/TensorInference.jl b/src/TensorInference.jl
@@ -5,6 +5,7 @@ using DocStringExtensions, TropicalNumbers
 using Artifacts
 # The Tropical GEMM support
 using TropicalGEMM
+using StatsBase
 
 # reexport OMEinsum functions
 export RescaledArray
@@ -20,6 +21,9 @@ export TensorNetworkModel, get_vars, get_cards, log_probability, probability, ma
 # MAP
 export most_probable_config, maximum_logp
 
+# sampling
+export sample
+
 # MMAP
 export MMAPModel
 
@@ -29,6 +33,7 @@ include("utils.jl")
 include("inference.jl")
 include("maxprob.jl")
 include("mmap.jl")
+include("sampling.jl")
 
 using Requires
 function __init__()
diff --git a/src/inference.jl b/src/inference.jl
@@ -49,7 +49,7 @@ function cached_einsum(code::NestedEinsum, @nospecialize(xs), size_dict)
 end
 
 # computed gradient tree by back propagation
-function generate_gradient_tree(se::SlicedEinsum, cache::CacheTree{T}, dy::AbstractArray{T}, size_dict::Dict) where {T}
+function generate_gradient_tree(se::SlicedEinsum, cache::CacheTree{T}, dy, size_dict::Dict) where {T}
     if length(se.slicing) != 0
         @warn "Slicing is not supported for generating masked tree! Fallback to `NestedEinsum`."
     end
@@ -58,7 +58,7 @@ end
 
 # recursively compute the gradients and store it into a tree.
 # also known as the back-propagation algorithm.
-function generate_gradient_tree(code::NestedEinsum, cache::CacheTree{T}, dy::AbstractArray{T}, size_dict::Dict) where {T}
+function generate_gradient_tree(code::NestedEinsum, cache::CacheTree{T}, dy, size_dict::Dict) where {T}
     if OMEinsum.isleaf(code)
         return CacheTree(dy, CacheTree{T}[])
     else
diff --git a/src/sampling.jl b/src/sampling.jl
@@ -1,15 +1,19 @@
 ############ Sampling ############
-
-########### Backward propagating sampling process ##############
-function einsum_backward_rule(eins, xs::NTuple{M, AbstractArray{<:Real}} where {M}, y, size_dict, dy::Samples)
-    return backward_sampling(OMEinsum.getixs(eins), xs, OMEinsum.getiy(eins), y, dy, size_dict)
-end
-
 struct Samples{L}
     samples::Vector{Vector{Int}}
     labels::Vector{L}
-    setmask::Vector{Bool}
+    setmask::BitVector
 end
+function setmask!(samples::Samples, eliminated_variables)
+    for var in eliminated_variables
+        loc = findfirst(==(var), samples.labels)
+        samples.setmask[loc] && error("varaible `$var` is already eliminated.")
+        samples.setmask[loc] = true
+    end
+    return samples
+end
+
+idx4labels(totalset, labels) = map(v->findfirst(==(v), totalset), labels)
 
 """
 $(TYPEDSIGNATURES)
@@ -21,48 +25,74 @@ The backward rule for tropical einsum.
 * `ysamples` is the samples generated on the output tensor,
 * `size_dict` is a key-value map from tensor label to dimension size.
 """
-function backward_sampling(ixs, @nospecialize(xs::Tuple), iy, @nospecialize(y), samples::Samples, size_dict)
-    idx4label(totalset, labels) = map(v->findfirst(==(v), totalset), labels)
+function backward_sampling!(ixs, @nospecialize(xs::Tuple), iy, @nospecialize(y), samples::Samples, size_dict)
     eliminated_variables = setdiff(vcat(ixs...), iy)
-    eliminated_locs = idx4label(samples.labels, eliminated_variables)
-    samples.setmask[eliminated_locs] .= true
+    eliminated_locs = idx4labels(samples.labels, eliminated_variables)
+    setmask!(samples, eliminated_variables)
 
     # the contraction code to get probability
     newiy = eliminated_variables
     iy_in_sample = idx4labels(samples.labels, iy)
     slice_y_dim = collect(1:length(iy))
     newixs = map(ix->setdiff(ix, iy), ixs)
     ix_in_sample = map(ix->idx4labels(samples.labels, ix ∩ iy), ixs)
-    slice_xs_dim = map(ix->idx4label(ix, ix ∩ iy), ixs)
+    slice_xs_dim = map(ix->idx4labels(ix, ix ∩ iy), ixs)
     code = DynamicEinCode(newixs, newiy)
 
-    totalset = CartesianIndices(map(x->size_dict[x], eliminated_variables)...)
+    totalset = CartesianIndices((map(x->size_dict[x], eliminated_variables)...,))
     for (i, sample) in enumerate(samples.samples)
         newxs = [get_slice(x, dimx, sample[ixloc]) for (x, dimx, ixloc) in zip(xs, slice_xs_dim, ix_in_sample)]
-        newy = Array(get_slice(y, slice_y_dim, sample[iy_in_sample]))[]
-        probabilities = einsum(code, newxs, size_dict) / newy
-        config = StatsBase.sample(totalset, weights=StatsBase.Weights(probabilities))
+        newy = get_element(y, slice_y_dim, sample[iy_in_sample])
+        probabilities = einsum(code, (newxs...,), size_dict) / newy
+        config = StatsBase.sample(totalset, Weights(vec(probabilities)))
         # update the samples
-        samples.samples[i][eliminated_locs] .= config.I
+        samples.samples[i][eliminated_locs] .= config.I .- 1
     end
-    return xsamples
+    return samples
 end
 
 # type unstable
 function get_slice(x, dim, config)
-    for (d, c) in zip(dim, config)
-        x = selectdim(x, d, c)
-    end
-    return x
+    asarray(x[[i ∈ dim ? config[findfirst(==(i), dim)]+1 : Colon() for i in 1:ndims(x)]...], x)
+end
+function get_element(x, dim, config)
+    x[[config[findfirst(==(i), dim)]+1 for i in 1:ndims(x)]...]
 end
 
 """
 $(TYPEDSIGNATURES)
 
 Sample a tensor network based probabilistic model.
 """
-function sample(tn::TensorNetworkModel; usecuda = false)::AbstractArray{<:Real}
+function sample(tn::TensorNetworkModel, n::Int; usecuda = false)::Samples
     # generate tropical tensors with its elements being log(p).
-    tensors = adapt_tensors(tn; usecuda, rescale = false)
-    return tn.code(tensors...)
+    xs = adapt_tensors(tn; usecuda, rescale = false)
+    # infer size from the contraction code and the input tensors `xs`, returns a label-size dictionary.
+    size_dict = OMEinsum.get_size_dict!(getixsv(tn.code), xs, Dict{Int, Int}())
+    # forward compute and cache intermediate results.
+    cache = cached_einsum(tn.code, xs, size_dict)
+    # initialize `y̅` as the initial batch of samples.
+    labels = OMEinsum.uniquelabels(tn.code)
+    iy = getiyv(tn.code)
+    setmask = falses(length(labels))
+    idx = map(l->findfirst(==(l), labels), iy)
+    setmask[idx] .= true
+    indices = StatsBase.sample(CartesianIndices(size(cache.content)), Weights(normalize!(vec(LinearAlgebra.normalize!(cache.content)))), n)
+    configs = map(indices) do ind
+        c=zeros(Int, length(labels))
+        c[idx] .= ind.I .- 1
+        c
+    end
+    samples = Samples(configs, labels, setmask)
+    # back-propagate
+    generate_samples(tn.code, cache, samples, size_dict)
+    return samples
+end
+
+function generate_samples(code::NestedEinsum, cache::CacheTree{T}, samples, size_dict::Dict) where {T}
+    if !OMEinsum.isleaf(code)
+        xs = ntuple(i -> cache.siblings[i].content, length(cache.siblings))
+        backward_sampling!(OMEinsum.getixs(code.eins), xs, OMEinsum.getiy(code.eins), cache.content, samples, size_dict)
+        generate_samples.(code.args, cache.siblings, Ref(samples), Ref(size_dict))
+    end
 end
diff --git a/src/utils.jl b/src/utils.jl
@@ -8,12 +8,15 @@ The UAI file formats are defined in:
 https://personal.utdallas.edu/~vibhav.gogate/uai16-evaluation/uaiformat.html
 """
 function read_uai_file(uai_filepath; factor_eltype = Float64)
-
     # Read the uai file into an array of lines
-    rawlines = open(uai_filepath) do file
-        readlines(file)
+    str = open(uai_filepath) do file
+        read(file, String)
     end
+    return read_uai_string(str; factor_eltype)
+end
 
+function read_uai_string(str; factor_eltype = Float64)
+    rawlines = split(str, "\n")
     # Filter out empty lines
     lines = filter(!isempty, rawlines)
 
@@ -193,5 +196,10 @@ function uai_problem_from_file(uai_filepath::String; uai_evid_filepath="", uai_m
     return UAIInstance(nvars, ncliques, cards, factors, obsvars, obsvals, reference_marginals)
 end
 
+function uai_problem_from_string(uai::String; eltype=Float64)::UAIInstance
+    nvars, cards, ncliques, factors = read_uai_string(uai; factor_eltype = eltype)
+    return UAIInstance(nvars, ncliques, cards, factors, Int[], Int[], Vector{eltype}[])
+end
+
 # patch to get content by broadcasting into array, while keep array size unchanged.
 broadcasted_content(x) = asarray(content.(x), x)
diff --git a/test/runtests.jl b/test/runtests.jl
@@ -13,6 +13,9 @@ end
 @testset "MMAP" begin
     include("mmap.jl")
 end
+@testset "MMAP" begin
+    include("sampling.jl")
+end
 
 using CUDA
 if CUDA.functional()
diff --git a/test/sampling.jl b/test/sampling.jl
@@ -0,0 +1,55 @@
+using TensorInference, Test
+
+@testset "sampling" begin
+    instance = TensorInference.uai_problem_from_string("""MARKOV
+8
+ 2 2 2 2 2 2 2 2
+8
+ 1 0
+ 2 1 0
+ 1 2
+ 2 3 2
+ 2 4 2
+ 3 5 3 1
+ 2 6 5
+ 3 7 5 4
+
+2
+ 0.01
+ 0.99
+
+4
+ 0.05 0.01
+ 0.95 0.99
+
+2
+ 0.5
+ 0.5
+
+4
+ 0.1 0.01
+ 0.9 0.99
+
+4
+ 0.6 0.3
+ 0.4 0.7 
+
+8
+ 1 1 1 0
+ 0 0 0 1
+
+4
+ 0.98 0.05
+ 0.02 0.95
+
+8
+ 0.9 0.7 0.8 0.1
+ 0.1 0.3 0.2 0.9
+""")
+    n = 10000
+    tnet = TensorNetworkModel(instance)
+    samples = sample(tnet, n)
+    mars = getindex.(marginals(tnet), 2)
+    mars_sample = [count(s->s[k]==(1), samples.samples) for k=1:8] ./ n
+    @test isapprox(mars, mars_sample, atol=0.05)
+end